就是能够让剧情的逻辑完成自洽文字转WAV音频