应该和他说的身份相同文字转WAV音频