随后他才开始打量周围的环境文字转WAV音频