最终还是只能选择放弃文字转WAV音频