而是直接控制能量文字转WAV音频