而这组镜头的先后完成顺序为文字转WAV音频