那边给的指示是让他尽量拍到照片文字转WAV音频