尤其是随着拍摄进程日益进展文字转WAV音频