然后将这一切拍摄下来文字转WAV音频