然后直接递给了他们文字转WAV音频