AI视频再度进化,再也不是无声电影丨11Labs的AI音效实时测评

2024-12-13 来源|AI图库吧

还记得在Sora在2月16号发布之后,AI声音届的巨头,11Labs,直接来了一次鬼才营销。

他们把第一波的Sora视频,直接配上了音效,然后做了一个剪辑放了出来。

而最关键的,就是这个音效了。

全部是由11Labs的AI直出,这可能也是第一个正式踏入大家眼帘的AI音效产品。

其实坦率的讲,在我心里,音效设计,一直是一个非常重要、难度极高但又容易被大家忽视的领域。

一部片子或者游戏能让你沉浸进去,你可能更多的会夸他的剧情、画面、配乐,但是很少有人会去夸他的音效,比如夸你这个关门声关的真真实等等...除非你是比如战地或者PUBG这种,游戏体验很**例是听枪声反馈的...

但是音效,是沉浸感中绝对重要的一环,而做一个优秀的音效,有时候难度更是超高,比如《哥斯拉》里面经典的吼声。

制作团队用了很多种方法去做哥斯拉的吼,比如用干冰升华时在金属通风管道中造成的震动和尖叫制作出了哥斯拉金属质感的长啸,比如他们在抛光过的地板上用大木箱拖动,拖出了那一阵阵令人毛骨悚然的胸腔共鸣。

这才有了这史上最著名的怪兽的惊鸿一瞥。

我说这些,是想告诉大家,好的音效设计,真的很难,也很贵。

而这,却正好让AI,有了用武之地。

在11Labs2月18号放出视频,并给出排队链接后,我当然是第一时间果断去排队了。

网址在此:https://form.typeform.com/to/gg0xzZW4?typeform-source=t.co

然后就...石沉大海,毫无音讯了。。

直到今天,在隔了将近1个月之后,我终于收到了11Labs的邮件。

终于有机会,来玩一玩,这个最强的AI声音公司11Labs的,AI音效了。

11Labs的官网在此:https://elevenlabs.io/

打开他们的页面,其实还是...挺简单的。。。

一个Prompt输入框,就,啥也没了。。

随便写一句Prompt:

On the concrete floor, a big fat man walked from a distance, getting closer and closer(水泥地上,一个大胖子从远处走来,越走越近)

大概不到10秒时间,音效就生成了,速度相当快。

11labs的做法也非常AI,一次性给你5个,你挑吧。反正都是要roll的,不如让你体验好一点。。

这一个prompt我roll了大概30条,个人感觉,勉强能用的比例大概在10%~20%左右,首先至少得是脚步声,再次是水泥地和大胖子,再次是越走越近。

有将近40%的比例我都听不出来是脚步声,更别提后面的两个细致要求了。

我这种非专业选手,能用的比例都这么低,更别提一些专业选手了。。。所以如此看下来,11Labs选择一次性放5条还是有道理的。

但是成本确实是低,roll的很快。

于是,我决定,不如复刻一下11Labs自己的营销做法。

用几个Sora发布的最新视频,AI音效配个音,让大家直观感受一下,效果到底怎么样。

标准是,每个Prompt我roll20条,然后选我认为的最优音效。

首先是:

"一只狗快速敲击键盘"

,时长00:10

"一辆F1赛车在赛道上飞驰"

,时长00:10

"用茶壶将水倒入水杯中"

,时长00:05

"外星人走在城市中,繁华的商业街,嘈杂的人群"&"汽车的鸣笛声"

,时长00:09

我个人跑了2个多小时,最直观的感受就是,真实感、声音的清晰度度还是差了一些,Prompt的语义理解也不是那么的好,有时候需要把Prompt拆开去跑,最后合一下才能用,不过毕竟是叠音轨,拆开跑我觉得不是很严重的问题。

整体上,离真正的可商用可交付,我觉得还是有不少距离需要走。现在类似于MJV2左右的水平。

无独有偶,11Lbas除了在自己的产品上,推了这个AI音效的功能之外,也在积极的跟一些AI视频公司合作。

比如PIKA昨天就刚上了AI音效。

虽然这次没说是用的哪家公司的API,但是猜也能猜到,大概率是接的11Labs的。

可以直接在生成视频的时候,带上音效,这个我觉得就非常非常的好用,且体验极佳。

整体上,AI音效,我觉得还不成熟,但是当视频卷的飞起的视频,AI声音,这个非常重要的赛道,不可能不卷的。

首当其冲的就是三块:AI配音、AI音乐、AI音效。

AI配音前有微软TTS后有11Labs,一群大模型公司又开始进场卷的飞起;AI音乐也有SunoAI初步走出来;AI音效,倒是一个没怎么被人卷过的领域。

但是未来,那可就不好说了。

作为半个声控,我还是希望这个领域,能发光发热。

给我们带来一些,在音效上的。

小小的震撼。

最新
更多

小度全新AI硬件将于百度世界大会发布丨智谱AI、即梦AI上线新一代视频生成模型丨OpenAI安全系统团队负责人离职

【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁

【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

李彦宏:文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布,搭载大模型边走边问

【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

巧妙利用这两个AI产品,让你的国庆出行没有废片

这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。

OpenAI初步谈妥融资70亿美元:最大金主微软追加投资10亿,苹果退出

据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。

详解Meta全新大模型Llama 3.2系列:多模态视觉识别能力媲美OpenAI GPT-4o

Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。

网站地图