既然都是使用能力文字转WAV音频