就是在等待我们先攻击文字转WAV音频