最终还是给出了一个理由文字转WAV音频