看起来双方似乎非常了解文字转WAV音频