只是看周边环境文字转WAV音频