只合成一个比之前稍微弱小了一些的人影文字转WAV音频