大部分时间都在闭关文字转WAV音频