最终选择了同意文字转WAV音频