开始的时候肯定是在暗中进行文字转WAV音频