也就是需要在外景中完成的场面基本都是被规划了出来文字转WAV音频