前几天 Sora 发布之后满心欢喜的去尝试,结果太令人失望了,图生视频基本不可用,同时还有频繁的生成失败和各种限制条件,基本等于诈骗。

很多博主也开始翻出可灵等其他模型去测试,发现不知不觉他们都已经这么强大了,我也顺便去可灵做了一个对比测试,做测试的时候才发现居然可以定制 AI 视频模型了,这个太强大了,试了一下给我惊艳到了,后面有介绍。

先来看看和 Sora 的对比,这次分了两个部分,文生视频和图生视频。

图生视频这里就别说了,Sora 的完全不可用,感觉成功率连 1% 都不到,大部分都不动,好不容易动了没按提示词动,或者在画面中加入了完全跟图片风格不同的内容非常出戏。

文生视频这里的话成功率上来了一些,但是画面完全不动的情况也时有发生,而且一旦涉及到一些非现实或者不常见的概念它就摆烂,开始生成 20 年前游戏画面那种劣质 3D 的视频。

然后我开始测试他们这个 AI 视频模型的功能,老实说创建过程确实有点繁琐。

但是,当我用我自己的模型生成第一个视频的时候,我觉得这些都是值得的,这是目前市面上独一份的视频生成 ID 保持技术,可以看藏师傅的梦想生活短片。

当然一些图片方案也可以达到在视频生成后 ID 保持的效果,但是要么有闪烁,要么保持的非常死板,图片什么样视频里就什么样,跟环境不融合,要么是在视频后半部分或者运动幅度大的时候无法保持 ID 的一致性。

但是可灵这个方案根本不存在这些问题,我在给朋友们看了以后他们的表情真的很精彩,有的对 AI 不了解的朋友真的以为我去做这些事情了。

首先是相似度真的爆表,比如我脸上的一些痘痘,还有感人的发际线,以及面部肌肉线条,都还原了,甚至我后脑勺的头发长度都是一样的,当然还有我的眼镜款式。

另外模型也不会一直死板的还原你现在的状态和样貌,当你生成不同的环境的时候他会根据场景对你的样貌生成一些变化,比如下面这个我在沙漠探险很长时间后,可灵就给我的胡子变得很长。

最后就是真实感了,因为是模型的原因,你的面部表情和神态动作都会学到,比如一些常见的表情,以及物理效果,这里面最好的部分是我跳伞的画面,真的我自己看到的时候都恍惚了一下。

那么说了这么多如何使用呢,你需要在可灵网页版左侧导航的 AI 模型进入,模型训练成本确实很高,所以需要钻石会员才可以创建,而且现在创建还会打折,只需要一半的积分。

整体大约需要 15 条 10 秒以上的视频,建议提前拍摄好,不要有其他人脸,人脸不要完全丢失,可以拍一大段然后自己剪成合适的长度,页面有非常详细的指引。

相信我,相较于结果来说这些成本是值得的。

AI 内容生成技术 70 分和 90 分的效果带来的影响和对内容消费者的触动完全是不同的,可能这就是可灵做这种成本很高的模型的功能的原因吧。

我在看第一条结果的时候真的都傻了,正因为我看 AI 内容很多,所以我知道这个质量意味着什么。

AI 内容生成的三座大山、ID 一致性、风格一致性、场景一致性,可以说 ID 一致性通过这种方式已经被完全解决了,期待可灵在另外两个一致性上给我们更多的惊喜。