然后再经过她的嘴流传出来文字转WAV音频