所以他依然得合理地分配体能文字转WAV音频