直到对方再次开口文字转WAV音频