但对方只是用一种文字转WAV音频