所以只能优化程序文字转WAV音频