他们并没有听见二者之间的对话文字转WAV音频