AI无疑是最近两年最炙手可热的技术,前有ChatGPT让文字工作者、程序员等岗位找到创作神器,最近OpenAI又发布了只需给出简单文本就可以制作60秒视频的Sora。通过演示视频我们可以看到,Sora虽然还处于一个测试的初级阶段,但已经足够强大了。这也引得不少影视行业从业者纷纷表示自己要被AI取代了。

不过看起来和视频行业没啥关系的汽车行业,也被Sora“吓”了一跳。在OpenAI对外发布Sora后,特斯拉CEO马斯克在社交媒体表达了惊叹。随后,他更多次在社交媒体上发表观点或回复评论,力证特斯拉在视频生成上的实力。那么,Sora到底有什么样的能力,让马斯克也不淡定了?

AI视频和汽车行业有什么关联?

很多人可能会觉得,Sora不就是一个AI剪辑吗?对于影视行业有巨大冲击不假,但对汽车行业有什么影响?难道是车企不用花费太多精力拍TVC宣传片了?

其实Sora和现有的一些文本生成视频模型相比,有着不小的突破,比如通过文本指令可以直接输出时长达到60秒的视频,并且能够保持视频主体与背景的高度流畅性与稳定性。此外,Sora对于文本有着深度理解能力,可以准确理解使用者给出的文本指令,从动作场景到细腻情感,Sora都能精确生成展现。

从演示视频来看,Sora对于真实的物理效果有着较高的还原度,比如光影反射、运动方式、镜头移动这些细节,都非常逼真,并且在单个视频中可以生成同一角色的多个镜头,即使人、动物和物体被遮挡或离开画面,Sora模型也能使其保持不变。

值得一提的是,Sora除了能够支持文本生成视频,还能够通过图片作为输入生成视频,并且也能生成图片。而应用在汽车领域,Sora大模型可以在智能座舱中,将文本、语音这些2D的大模型交互形式升维至3D形式,交互体验更加出色的同时,也可以把沿途拍摄的视频在线实时剪辑增添更多玩法。

再往深层次探索,当下车企通过九轴模拟器进行底盘调校的同时,也在同时进行自动驾驶模型的训练,而Sora的画面生成能力,就能够提供比传统地图建模更加拟真的效果,有效提升训练效率。

这样一来,能够根据文本、图片生成视频的Sora,就有更多机会融入进自动驾驶领域,毕竟自动驾驶对于大模型的需求是巨大的,而OpenAI将Sora定位也正是模拟世界的视频生成模型,并且能够模拟真实世界运行的规律。

而这也是马斯克看到Sora发布后反应颇大的原因所在,当然马斯克的发言主要是在力证特斯拉在视频生成上的实力,在社交媒体上马斯克表示“特斯拉在大约一年前就能以精确的物理生成真实世界的视频。只不过,由于训练数据来自汽车,生成的视频并不有趣。这些视频看起来像特斯拉的普通视频,实际上是通过动态生成的。”

Sora能成为自动驾驶的助燃剂?

在国内,也有不少行业大佬对Sora的未来进行了展望,360公司创始人、董事长周鸿祎就提出,人驾驶汽车的更多判断是基于对世界的理解,而Sora对世界的理解更上一层楼,因此对无人驾驶有启迪意义。

中科院计算所研究员山世光也发表了看法,表示“Sora对AGI世界建模问题的研究有重要推动作用——它不止可以完成文本生成视频,更重要的是可以被看作建模世界底层物理规律的模型。”

其实自动驾驶与AI之间的关系是密不可分的,Sora带来的AI进阶,也预示着自动驾驶在未来可能会出现的进化。前面我们提到Sora拥有视频编辑和操纵能力,未来完全有可能作为自动驾驶系统中的场景重构和仿真工具。

正如马斯克在其社交媒体上的回复所说,“特斯拉视频生成超越OpenAI的地方在于,它预测了极其精准的物理场景,这对自动驾驶至关重要。”

Sora利用AI生成视频的能力,还有一个应用点,那就是提升对于视觉信号的应用能力,这也是最具备可实现性的一个应用领域。很多人都知道,现在有一种工作叫做AI训练标注师,而随着Sora的出现,这项工作可能就要完全被AI取代了。比如交警的手势、移动物体的识别、特种车辆的避让、交通异常的识别,都可以通过Sora生成的视频模型来训练自动驾驶的识别能力。

而这种训练能力提升的关键就在于,Sora何时能拥有生成三维大模型的能力,至少现在60秒的视频是不太够用的。一旦进化到上述程度,物理世界和数据世界的鸿沟将会迅速抹平,在无限趋近真实的测试环境中进行测试,自然自动驾驶系统可以更好地学习真实世界的物理规律和底层逻辑,并且能够预测人与物的行动轨迹,这种认知与预测,对于自动驾驶能力的提升无疑是至关重要的。

AI元年来临

车企普遍加大智能领域投入

诚然,Sora目前还处于内测阶段,OpenAI官网也坦言现版本的Sora也有自己的弱点,比如物理特性并不那么真实,在某些特定场景下生成的视频还是有些“魔幻”的。不过Sora的登场,无疑会在各个行业掀起一波AI潮,各大车企势必也将加速AI领域的研发。

比如吉利汽车就在开工信中表示,AI将成为智能汽车的分水岭,没有AI的只是出行工具,具备AI的才是智能伙伴。早在1月份,吉利汽车就发布了“星睿AI大模型”,这套模型由2023成立的星睿智算中心强大的算力为基础,目标是让汽车变成了一个“智慧生命体”。

小鹏汽车CEO何小鹏在节后开工第一天发布的一封内部公开信中提到,在节后开工第一天发布了一封内部公开信,当中提到要投入共计35亿元,发展以智驾为核心的AI技术。按照何小鹏的说法,今年是小鹏迈向高阶智能驾驶,让高阶智驾走出国门走向全球的第一年。AI,无疑将在当中发挥重要作用。

从传统车企到造车新势力,已经有不少车企在AI这条新赛道抓紧布局,AI上车也注定会成为一个新的趋势。而在2024年,也将会有越来越多的车型在AI大模型的帮助下快速登陆市场。

车叔总结

随着Sora的推出,已经有不少人开始畅想这样一个场景:通过ChatGPT给Sora下达指令,通过不断的训练、计算,提升工作效率。对于车企来说,AI这条赛道刚刚起步,还有待更多的探索与发展,Sora的出现只不过是提供了一个新的发展方向和思路。Sora这样的AI工具能带来怎样的新应用场景?会像马斯克所说,“人类,愿赌服输”吗?