然后运用肖恩那里研究出来的融合器文字转WAV音频