镜头也多的场景反复重拍了大半天文字转WAV音频