反而在事件发生后文字转WAV音频