并把视频和翻译的对话他看文字转WAV音频