从刚才对方的表现来看文字转WAV音频