毕竟这是他们自己的选择文字转WAV音频