就是观察周围文字转WAV音频