就是在控制的区域内文字转WAV音频