而是直接将具体情况告诉了我们文字转WAV音频