尽量多收集现场照片文字转WAV音频