Sora(OpenAI发布的人工智能文生视频大模型)
类别专家评价科技界英伟达科学家DrJimFanSora是一个数据驱动的物理引擎,它是对许多世界的模拟,无论是真实的还是幻想的,模拟器通过一些去噪和梯度数学来学习复杂的渲染、“直观”物理、长期推理和语义基础 [10]。趣丸集团副总裁庄明浩Sora的面世影响的不仅是文生视频领域,下一步将是过去一年各家游戏物理引擎厂商们一直在尝试的自然语言改造生产流程,以及3D素材生产这个战场 [10]。伊利诺伊大学厄巴纳-香槟分校信息科学教授特德·安德伍德没想到在接下来的两到三年内还会出现这种持续、连贯的视频生成水平 [22]。普林斯顿大学计算机科学教授Arvind Narayanan根据OpenAI发布的视频,Sora似乎比任何其他视频生成工具都“先进得多”,这可能会导致“深度伪造”视频,人们更难识别出人工智能生成的视频 [22]。360集团创始人、董事长周鸿祎Sora将缩短AGI(通用人工智能)实现时间,从10年缩短到1年。OpenAI训练该模型应该会以视频和摄像头捕捉的画面为主,人工智能通过观看大量视频将对世界有更深入的理解,这离AGI实现不远 [32]。图灵奖得主、Meta首席AI科学家杨立昆根据提示词生成的大部分逼真视频并不表明这样的AI系统理解物理世界,生成视频的过程与基于世界模型的因果预测完全不同 [41]。影视界电影导演兼视觉效果专家迈克尔·格雷西很快,像Sora这样的人工智能工具将允许电影制作者仔细控制他们的输出,从头开始创建各种视频,当技术剥夺了其他人的创造力、工作、想法和执行力,却没有给予他们应有的荣誉和经济报酬时,不是一件好事情 [22]。专业摄影师孟凡Sora视频帧率较高,说明计算能力比较强,且影片的宽容度更高,如调色、细节表现、高速镜头展现等。在直观感受上,Sora 模型产出的视频运镜自然,物体运动符合规律,镜头间逻辑一致性好,但是Sora视频的逻辑性会差一点 [41]。中国电影文学学会副秘书长杜红军编剧、导演不必因Sora的出现而担心,它是帮助实现影视效果的好工具,能够激发更多人的内容创造力。人类负责创意,AI负责创造,未来的电影创作将是概念片先行,可能不是在写剧本,而是“写”影像 [48]。社会界中国社会科学院法学研究所副研究员唐林垚相较于其他视频类生成式AI,Sora在画面清晰度、内容流畅度、表意深度和精彩程度方面均有大幅提升,如果Sora的能力真如官方公布一样强大,且之后可以像ChatGPT一样便捷访问,那么Sora将给广告行业、影视行业和特效行业带来极大的冲击。 [37]前记者、现斯坦福大学研究员巴西勒·西蒙在生成式人工智能方面有了可怕的飞跃,可以快速生成逼真的作品,这些工具可能会在选举中被滥用,公众将可能“不再知道该相信什么” [42]。复旦大学教授、上海市数据科学重点实验室主任肖仰华意料之中也意料之外。所谓意料之中,是因为ChatGPT诞生之后,业内专家都普遍预测大模型一定会从纯文本的大模型向多模态发展。所谓多模态指的是图文混合、和视频相结合的这类大模型。意料之外是指当你亲眼看到了Sora生成的视频具备如此的逼真度,冲击力还是很激烈的。它对模拟物理世界的逼真程度,达到了空前的水平,是之前人工智能技术从来没有做到过的 [55]。