我们三方都需要进行一次合作文字转WAV音频