其实也是监视文字转WAV音频