探测在区域内的移动物体文字转WAV音频