也分辨出了对方的身份文字转WAV音频