真实降维打击!Sora横向对比Runway、Pika、AnimateDiff、LeonardoAI四款主流AI视频生成模型

2024-12-13 来源|AI图库吧

今年最火爆的科技圈爆品,要属蹿红的Sora,把AI视频时间延长到了「史诗级」的60秒,并且还支持生成多达5个不同的机位,还能保持良好的逻辑一致性。

但是坦率地讲,Sora距离一部完整的带剧情电影,还是差得远。或许可以期待,年内我们就能看到Sora创作的一部5、6分钟的微电影。

不妨把眼光下放到与竞争对手的PK上,更能看出Sora对行业的影响力。同在AI视频领域横向比较的话,目前确定的是,Sora无人可匹敌。

2月29日,OpenAI的ChatGPT研究员Jason Wei在网上透露,目前Sora的形态与能力大概可与GPT-2时期相当。(备注:GPT-2在2018年推出)

日前,国外一名创作者,就利用Sora官网上提供的提示词,比较了目前同赛道的几款竞品的生成效果。包括:Runway Gen-2、基于Stable Diffusion的AnimateDiff、Pika,以及LeonardoAI。

首先进行“文生视频”考核,比较的是Sora模型的代表作——「夜幕下日本街头行走的女子」。

一句话,Sora鹤立鸡群。而其他竞品当中,LeonardoAI的整体质感尚可。

接下来考核“图生视频”,我们的小哥尝试把题目难度往下放,用一张Midjourney生成的优质成片来创作AI视频。

这是Sora的四款竞争AI视频生成工具所衍生的视频作品。

这次是基于Stable Diffusion的AnimateDiff模型质感更好一些。

AnimateDiff的工作原理是在Stable Diffusion模型中插入一个动作建模模块。该模块在大量的视频参数上学习生成合理的物体运动。

接下来对比的是「航拍海岸礁石」,Sora对比Runway是这样的。

对比AnimateDiff是这样的。

Pika是这样的,海浪出现了反方向的情况。

LeonardoAI的整体质感尚可,但海浪有明显的逻辑错误。?

接下来是AI生成「雪地玩耍的小狗」视频的效果对比。

综合来看,客观地说,这则提示词下,几家工具的创作都还可以,基本还原提示词的场景,LeonardoAI的质感最接近Sora。

当然,Sora的出片表现张力依然鹤立鸡群。

以下是「山地公路吉普行车」的效果对比。

从这组对比,大部分的AI视频工具崩坏就比较严重了,甚至无法理解吉普车行驶的前后逻辑。

而LeonardoAI是本次对比测评当中,是最令我印象深刻的一款工具。

Sora比起其他的AI视频工具,拉开的性能差距可不止一条街。

近日,有开发者将一张Midjourney创作的后厨图像,利用Sora生成了一段厨房里边热火朝天的忙碌场景短片,长达22秒。不仔细看的话,整体可圈可点。

前阵子,国外社区有消息指出,Sora生成一分钟的视频,需要最强大的显卡运算一个多小时。

不过,只要你曾经自己剪辑过视频、问问身边做3D图像渲染的朋友,就知道这个时间成本其实并不算什么。

难以置信,等到Sora正式上线以后,电影工业会被颠覆成什么样子。

最新
更多

小度全新AI硬件将于百度世界大会发布丨智谱AI、即梦AI上线新一代视频生成模型丨OpenAI安全系统团队负责人离职

【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁

【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

李彦宏:文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布,搭载大模型边走边问

【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

巧妙利用这两个AI产品,让你的国庆出行没有废片

这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。

OpenAI初步谈妥融资70亿美元:最大金主微软追加投资10亿,苹果退出

据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。

详解Meta全新大模型Llama 3.2系列:多模态视觉识别能力媲美OpenAI GPT-4o

Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。

网站地图