所以他们只要等文字转WAV音频