应该是两方说的是同一个人才对文字转WAV音频