直接使用这种融合的能力文字转WAV音频