就是调集各种能量来拼接和拆封文字转WAV音频