只是在一些关键点上怕有遗漏文字转WAV音频