现场所有人都能够感应到文字转WAV音频