从这样的状态中拉回现实文字转WAV音频