明明可以控制全局文字转WAV音频