到时候现场肯定很难控制文字转WAV音频