毕竟他们不太希望文字转WAV音频