要么是在等待同伴回归文字转WAV音频