他需要很长的时间才能慢慢吸收文字转WAV音频