几乎听不到原有的嗓音文字转WAV音频