最后商议出来的对策就是一个文字转WAV音频