开始在第一层感应寻找起来文字转WAV音频