然后得到了来自观里的回应文字转WAV音频