主要部分还是在于国外文字转WAV音频