反应慢的则是抓住前面的人向后拽文字转WAV音频