所以我们会给出两个条件文字转WAV音频