但也是尽可能的维持着嗓音文字转WAV音频