因此他省略了原本应该进行的语言交流文字转WAV音频