好像是适应了一般文字转WAV音频