但同样都是吃多少吐多少文字转WAV音频