导 读: 新闻视频的素材永远需要专业记者亲自去拍摄或有现场的监控视频,不可能先验地存在于大模型中。大模型对于新闻视频,永远具有滞后性。

美国当地时间2月15日,开放人工智能研究中心(OpenAI)发布了最新的视频生成模型Sora。高清的画质、逼真的效果、流畅的切换、多样的风格、丰富的细节、惊人的创造力……笔者看完43个Sora根据提示语生成的视频后,不禁叹服。

“一石激起千层浪”,Sora出色的视频生成能力震惊世界。美国特斯拉创始人兼首席执行官马斯克直言:人类认赌服输。360集团创始人、董事长周鸿祎则称:随着Sora的到来,人类离AGI(通用人工智能)真的不远了,不是需要10年、20年,可能两三年就可以实现。

Sora究竟有多强?从生成的视频来看,不仅可一镜到底,而且支持多机位多角度拍摄;不仅能模拟物理世界,更能呈现虚拟的科幻、艺术世界。OpenAI称,Sora能深刻地理解语言,不仅能理解用户文本提示,而且能理解所述事物在物理世界中的存在方式。“我们正在教授人工智能理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要与现实世界交互的问题。”

Sora并非完美无缺。一名谷歌董事将一条Sora生成的视频发给谷歌的多模态大模型 Gemini 1.5 Pro,让其点评一下。Gemini 1.5 Pro犀利地指出了视频中不合逻辑的地方:

“这段视频是在日本一条雪街上拍摄的,樱花盛开。有一些不一致之处表明这段视频可能是由人工智能生成的。首先,雪花纷纷扬扬地飘落,但樱花依然盛开。樱花通常在春天盛开,应当天气温暖而没有雪。其次,雪以非常均匀的方式下落,这并不是雪在现实生活中通常下落的方式。再次,尽管下着大雪,但视频中的人们没有穿任何冬季衣物。总的来说,这个视频在视觉上很吸引人,但不一致之处表明这不是一个真实场景。”

OpenAI承认,目前Sora生成视频中可能包含不合逻辑的图像,混淆左右等空间细节,难以准确模拟复杂场景的物理原理和因果关系等。它发布的48个Sora生成视频中,就有5个不成功的案例。如在考古工作者挖出一把塑料椅子的视频中,Sora未能将椅子作为刚性物体建模,导致物理交互不准确。在另几个视频中,Sora难以准确模拟物体和多个角色之间复杂的互动;物理建模不准确,导致“穿模”;动物或人可能凭空出现等。

正因为Sora存在许多问题没有解决和不完善之处,OpenAI尚没确定何时面向公众开放。目前仅主要向一些设计师和电影制作人等特定人群提供Sora访问权限,以获取有关改进该模型的反馈。

笔者认为,即使Sora将来面向公众开放,也不会砸掉新闻工作者尤其是新闻视频工作者的饭碗。

理由很简单。因为新闻是新近发生的事实的报道,真实是新闻的生命。新闻视频对于生成视频的大模型来说,视频素材来源永远是现在时或将来时,不可能先验地存在于大模型中。也就是说,大模型对于新闻视频,永远具有滞后性。新闻视频素材永远需要专业记者亲自去拍摄或有现场的监控视频。

如果说视频生成大模型能生产新闻视频,那就违背了起码的人类认识规律和新闻生产规律。

也许有人这样想象,Sora既然能模拟物理世界,不远的将来,视频生成大模型也能像人一样随时随地感知、反映现实世界,随时随地拍摄发生的新闻。但遍布世界每个角落需要多少传感器、监控器?这更会受到国家主权、国家安全方面的限制,隐私和伦理问题也无法解决,既无现实可能性,也没有必要。

新闻工作者面对人工智能的飞速发展,不必为饭碗焦虑,但要积极主动学习,利用人工智能辅助工作,提高工作效率。如利用视频生成工具制作解释新闻的直观画面,将新闻报道中的复杂人物关系可视化;模拟或还原新闻事件的场景(需要在画面显著位置标注“画面系Sora根据记者搜集信息生成”字样);数字新闻人主持播报新闻;利用视频生成工具制作文艺表演、广告宣传、微电影、短剧等非新闻视频等。

人工智能技术在新闻媒体中的应用前景广阔。新闻媒体要进一步加强对人工智能技术的应用,在新闻线索采集、组织策划报道、采写拍摄制作、审核分发、运营传播等方面全方位利用人工智能技术赋能。

新闻媒体也要做好应对人工智能挑战的准备,如Sora的应用可能催生“深度伪造视频”,进一步模糊真实与虚拟的边界。新闻媒体为防止虚假新闻,要开发检测视频真伪的工具,进一步加强事实核查;加强对人工智能生成内容的审核力度,等等。

总之,无论人工智能有多强,其都应是新闻工作者的辅助工具。