以下文章节选自丨APPSO
上周,是春节后开工的第一周。
全网都被Sora的热度刷屏了一周。各种讨论、争辩与割韭菜,不绝于耳。
这是AI生成的「威尔·史密斯吃意面」吗??
——并不是,这是他亲自实拍的Sora视频模仿秀。
虽然Sora还未对外开放,但互联网已经变得越来越荒诞。
AI越来越像真的,真人越来越热衷假冒AI。Sora能不能杀死好莱坞我不知道,但是先把我大脑干烧了。?
Sora稳定发挥的视频,我们或多或少都看过一部分,比如下面这个提示词为「考古学家在沙漠发现一把普通的塑料椅子,小心地挖掘并除尘」的AI视频。
这张椅子好像一个有想法的生物,不受牛顿理论的约束,还偷偷带走了一个人类。
光怪陆离的视频被分发到社交媒体,可能会打上这样的标签:#意识流、#超现实主义、#人类早期驯服野生椅子的珍贵视频…
针对这条视频,OpenAI认真地解释了为什么出现物理学的Bug:
「Sora未能将椅子建模为刚性物体,即外力作用下不改变形状和体积的物体,所以导致物理交互不准确。」
比如Sora生成的这个摔碎玻璃杯的视频,杯子并没有摔碎,液体像果冻一样粘连在一起,滑稽而又匪夷所思。
另外,还有倒着使用跑步机的健身者、怎么也吹不灭的生日蜡烛、凭空闪现的小狼、四只腿的蚂蚁?......
AI在不经意间,做出了人脑和特效都想不到的事。
Sora官宣以来,两派的AI技术大佬持续争论——它能否理解物理世界?
OpenAI始终不对外澄清这一点。
只是强调,Sora可以模拟现实世界中人、动物和环境的某些方面,但可能难以准确模拟复杂场景的物理原理,比如混淆左右、咬了饼干后没有咬痕。
但不妨碍OpenAI将Sora称之为「世界模拟器」。
外界普遍推测,Sora基于游戏引擎「虚幻5」打造,那的确可以实现以假乱真。
趁AI还未进化到完全态,不妨脑洞大开。还不稳定的AI视频,完全可以作为灵异、悬疑、恐怖、魔幻题材的素材库,为创作提供新的灵感,越要掀翻牛顿棺材板,表现得就越具艺术性。
尽管内容已经如此魔幻,还是有网友犹豫了一秒:「不露一帧Bug,我都怀疑它是实拍。」
哪怕是Sora的“翻车视频”,其时长、画质、稳定性也依然能够吊打Pika、Runway等业界「老前辈」。
当其他工具生成的视频不过3-4秒。Sora直接把这条赛道的门槛从保持单镜头稳定,直接往上拉至1分钟,还能实现多机位的无缝切换,相对准确地保持画面主体和视觉风格的一致,仿佛会用镜头语言和叙事节奏讲故事。
乍看之下,好像现场真的有摄像机跟拍,人、物体和场景都在三维空间里移动,同个角色还能有多个视角。
Sora可以实现多个视角还原日本街头的Sakura。?
2024年,AI生成影片实现从「动态图」到「视频」的飞跃。
对此,360董事长周鸿祎分享了一个很有意思的观点:
他认为,Sora工作原理像人类的做梦,我们会梦到奇奇怪怪的东西,但依据的是我们在生活中眼睛看到的东西、积累的经验,不用像电影工业那样3D建模然后一帧帧地渲染。?
从某个角度看,生成式AI确实像一台造梦机器,越来越接近人类的思维方式,用各种提示词有概率地制造合理或者不合理,不论对错,它一定会给你一个答案。
其实从ChatGPT开始,人们就想借着AI将梦境落地,小红书上有不少将梦境可视化的AI创作内容帖,虽然无法真正还原脑海的效果,却也将部分精神世界的幻影带入了现实。
看这两艘海盗船在咖啡杯里边激战,又是一个激动人心的杰克船长大战反派的故事。
“一败涂地”的人类,正在将模仿Sora当成流量密码
翻车视频之外,Sora的其他视频乍见惊艳,但也经不住放大镜式的审视。店铺招牌的乱码、猫的第五条腿、模特踏错的步伐......
虽然Sora还没有开放给公众使用,但卖课和卖显卡的人都赚钱了。
玩梗的乐子人在社交平台上发布视频时,只需要在文案当中加入「由Sora生成」几个字,然后编一段像模像样的提示词,就可以伪造一支AI制作的短片。
效果立竿见影,播放量直接拉满!
△滑冰爱好者伪造的“最伟大的灌篮”。
△一段游戏的录屏,也可以充当Sora生成的话题元素。
最让人真假难辨的当属宝莱坞电影,印度警匪片的情节和特效惊为天人。东方大国的想法太超前了,物理学早就不存在了,连AI都要向他们拜师学艺。
如果不是热心群众添加注释,附上11年前的一部印度电影YouTube地址,恐怕谁也不敢打包票这到底是人类创作还是AI生成。
以上并不是在故意玩梗…
这甚至引来了Netflix印度地区的官号也来蹭热度。
小编从印度「抗英神片」《RRR》截取一则片段伪装是Sora生成,发布到了推特(X)平台上,开头的这几秒实在太唬人了!
假冒AI视频整活,源自于Sora过人的视频拟真能力,远远超出普通人的知识储备。
混淆视听、自作自受,伤害可能还是人类自身,网友们开始担心,当AI生成和真人实拍真的傻傻分不清楚,自己没做过什么,却可能「证据确凿」。
悬疑英剧《真相捕捉》上演的情节:情报机关为了给罪犯定罪,伪造了监控录像。
他们认为,伪造监控录像,只是将窃听材料等非法证据,「重演」为合法证据,事情的确发生了,罪犯的确犯罪了。
技术无罪,但是谁也不知道使用技术的人是否别有用心。
甚至还有人通过熟识AI的Bug,反其道而行……
比如,因为AI不擅长画手,罪分子戴着假手指犯罪,看起来有六根手指,就可以污蔑监控画面由AI生成,且没法作为呈堂证供。
今天的AI,还远未能与人脑相匹敌。
AI创造的世界越接近现实,人类也就越容易假冒AI。
AI还没法主动作乱,打破信任的还得是人类自己。
AI还未必能模拟世界,但已经影响了我们看待世界的方式
最近,OpenAI开设TikTok(国际版抖音)账号,上传一批Sora的作品。
OpenAI为每一个视频都贴上标签「AI生成」。
OpenAI还在视频画面当中特别强调——由文生视频模型Sora生成。
观看者稍不注意,都会以为是实拍场景。
有AI技术的从业者认为,OpenAI目前在TikTok发布AI视频,可能是为了收集用户观看的数据反馈,对模型熟悉来自人类反馈的微调。
说不定,未来甚至会打造一个AI概念的TikTok。
事实上,目前已经存在24小时不间断播出内容的AI视频平台了,由Runway打造的RunwayTV。
未来,我们的观影体验也可能发生质的变化,不依赖于电影制作公司和流媒体,可以用大语言模型来决定自己想看的故事内容和演出阵容。
相比于Sora可以生成1分钟的高质量视频,在去年已经有不少剪辑大师利用Runway、Pika等视频生成工具打造电影级的预告片。
视频风格以快速剪辑为主,搭配旁白,注重节奏感和视觉冲击,也能构筑富有剧情的信息点。但缺少人物的对话和更复杂的场景展示。
未来,Sora可以创作一镜到底的AI视频,再用AI配音工具就能制作一则近乎完美的电影预告片。
△这是由Sora生成的美国西部淘金热的纪录片场景。
AI很擅长模仿现实世界的物理环境,比如火车车窗上的倒影,活脱脱就像一支Vlog。
2050年尼日利亚的城市风光,镜头从露天集市移动到都市天际线,不仔细看人物的细节,难以察觉个中的Bug。
对于那些旅游推广账号以及营销号作者,更是狂喜。已经没有购买大疆无人机的必要性了。
Sora可以通过提示词,直接制作某个旅游景点的鸟瞰图。
我们脑补的圣托里尼长什么样,AI就能给你模拟出来。
有网友笑称,如果将Sora+苹果Vision Pro结合起来,那将是最原始的《地球Online》模拟游戏。
Sora官方新闻稿页面直接提出「世界模拟器」的概念,某种程度上是把一切人类活动当作信息输入,汲取文字、图像、视频的养分,然后又输出信息,把文字变成绘画,把图片变成视频,仿佛《地球Online》的主宰。
这样的设定变为现实或许还要假以时日。
OpenAI自认的Sora代表作——这位行走在东京街头的女子,神态里边没有情感,感受不到人的气息。
真的很像《黑客帝国》里边的主角团,正在酝酿反抗数字生命的倒计时。
曾有网友表示,有没有一种可能,AI正在试图利用Bug来尝试伪装自己。?
AI参与感越来越强的未来,下次看到一个疑似的Bug,我们可能不会直接判断它是虚构的,会开始怀疑,AI是否别有用意?
未来已来,我们可能不喜欢,也得接受。
上一篇:Stability AI推出图像高清放大AI工具丨荣耀推出首款AI PC丨中兴发布自研AI大模型,并推出首款AI手机
年后开工第一周,全网都被Sora的热度刷屏了一周。虽然Sora还未对外开放,但互联网已经变得越来越荒诞。AI越来越像真的,真人越来越热衷假冒AI。
【AI奇点网2024年2月27日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
大语言模型(LLM)在生成文本内容方面非常强,但在理解、生成视频、图像等方面略显不足。尤其是在Sora一夜爆红之后,让人们意识到未来主流模型一定是文本+音频+图像+视频的多模态生成、理解功能。
近日,广州互联网法院正式对外生效了一起关于生成式AI服务侵犯他人著作权判决,这也是全球范围内首例生成式AI服务侵犯他人著作权的生效判决。
成立9个月,当初那个「6人团队,7页PPT,8亿融资」的公司不断缔造传奇。Mistral AI今日发布的Mistral Large模型性能已经直逼GPT-4,同时和微软官宣合作。「下一个OpenAI」的爆相,已经越来越明显了。下一个OpenAI来了? 开源社区的另一个中心Mistral AI,刚刚发布了最强力的旗舰模型Mistral Large,性能直接对标GPT-4!(但可惜的是没有开源) Mistral Large具备卓越的逻辑推理能力,能够处理包括文本理解、转换以及代码生成在内的复杂多语言任务。 在众多主流基准测试中,Mistral Large力压Anthropic的Claude 2和谷歌的Gemini Pro,成绩仅次于GPT-4! LLM领域,格局再次改变。 同时,就在今天,AI圈又一重磅消息曝出:继OpenAI之后,微软将Mistral也纳入麾下! Mistral从诞生之初,就充满传奇的光环。成立4周,6人团队,7页PPT,8亿融资(1 05亿欧元),简直堪称爽文走进现实。 创始人Arthur Mensch是1993年出生的法国小伙,在谷歌工作3年后,在自己31岁时离开谷歌,拉拢了两位Llama模型的开发者,一起创立了这个日后可以和OpenAI、Anthropic分庭抗礼的公司。 几个人的团队,极少的融资,做出的模型却可以和GPT-4掰手腕。 如今再加上金主爸爸微软的撑腰,Mistral 「下一个OpenAI」的名头,是坐实了。 Mistral不开源?网友慌了! 现在,正处于全世界聚光灯下的Mistral,一举一动都十分引人注目。 有网友发现Mistral修改了网站内容,删除了所有提及开源社区义务的内容,这立马引发了恐慌! 之前的主页(左);现在的主页(右) 不过,大家目前还不需要太过担心。 根据外媒对Mistral CEO的采访,未来他们依然会坚持开源理念,但是同时也会推出性能最为强大的闭源模型参与商业竞争。 现在他们已经完成了以规模命名的开源模型:Mistral 7B和Mistral 8 x 7B回馈社区,以「大中小」命名的闭源模型赚钱的产品线搭建。 欧洲最强大模型来了! 话说回来,这次发布的Mistral Large,可以说是最适合欧洲人体质的大模型。 简单来说: - Mistral Large能够母语般流利地使用英语、法语、西班牙语、德语和意大利语,深刻理解各自的语法规则和文化背景。 - Mistral Large能够处理32K Token的上下文内容,使其能够从庞大的文档中精确快速地提取信息。 - Mistral Large在执行具体指令方面异常精准,这让开发人员可以根据自己的需求定制内容审查政策——例如,Mistral AI利用它来进行了le Chat的系统级别审查。 - Mistral Large原生支持函数调用。这个特性,结合Mistral AI在la Plateforme上实施的输出内容限制模式,极大地促进了应用程序的开发和技术栈的现代化。 目前,Mistral AI的这个新旗舰模型仅在Azure AI和Mistral AI平台上可用。 其中,在Azure AI上的定价如下:输出为0 024美元 1000 token,输入为0 008美元 1000 token。 推理能力与知识掌握 要说Mistral Large最令人印象深刻的,还是超强的推理能力。 作为旗舰模型,Mistral Large在常识、推理以及知识方面,都展现出了令人瞩目的实力。 虽然和GPT-4还有不小的差距,但Claude 2和Gemini Pro 1 0基本上已经是手下败将了。 多语言能力 作为一款欧洲人自己的大模型,Mistral Large在法语、德语、西班牙语和意大利语上的表现,均优于Llama 2 70B模型。 同时,也强过自家更小规模的模型。 数学与编程能力 在编程和数学方面,Mistral Large的能力也非常突出。 不仅相比自己其他模型有了大幅的提升,而且在主流的测试基准上都取得了不俗的成绩。 「小杯」也来了 相比之下,规模更小的Mistral Small,则更加专注于对延迟和成本的优化。 相较于Mixtral 8x7B,Mistral Small展现出更优异的性能和更低的延迟,是介于Mistral AI开源模型和旗舰模型之间的解决方案。 与Mistral Large类似,Mistral Small同样采用了在RAG和函数调用方面的创新技术。 此外,Mistral还优化了自家的服务接口: - 提供竞争力价格的开放权重端点,包括open-mistral-7B和open-mixtral-8x7b。 - 推出新的优化模型端点,包括mistral-small-2402和mistral-large-2402 同时继续提供未更新的mistral-medium。 和微软官宣合作,Mistral AI腰板更硬了 除了宣布模型之外,Mistral AI还官宣了和微软的深度合作。 而这也是微软继OpenAI之后,再次「真金白银」地入股AI圈的另一家顶流模型公司。 虽然2023年4月才成立,Mistral AI已经对欧洲的AI领域产生了重大影响。 开源模型Mistral 7B和Mixtral的发布,惊艳了一众开发者,在AI社区掀起了轩然大波。 如今微软的支持,让更多人坚信:Mistral就是下一个OpenAI。 Mistral AI是法国的AI初创公司,微软与它的合作,无疑让微软在欧洲也建立起了自己的AI影响力。 两家公司的合作,目标是弥补基础AI研究与实际解决方案之间的差距。 如果在未来建立多年的合作伙伴关系,Mistral AI就可以访问微软Azure的AI基础设施了。 微软的加持对Mistral AI意味着什么,不言而喻。 不光Mistral AI下一代LLM的开发和部署会大大加速,并且会开辟出新的商机。以欧洲为基础,Mistral AI会向全球市场扩张自己的影响力! 具体来说,微软和Mistral AI之间的合作集中在以下三个关键领域—— 超算基础结构:微软将通过Azure AI超算基础结构支持Mistral AI,用于AI训练和推理工作负载。 扩展市场:微软和Mistral AI将通过Azure AI Studio中的MaaS和Azure机器学习模型目录,向客户提供Mistral AI的高级模型。 AI研发:微软和Mistral AI将探索合作,为指定的客户开发专有模型,甚至包括欧洲公共部门的工作负载。 目前,两家公司还没有透露财务细节。 最近,Mistral AI以近20亿美元的估值,筹集了4 5亿欧元,由科技投资者Andreessen Horowitz领投。 不过,跟它在美国的竞争者比,Mistral AI所获得的资金显然并不算多。 要知道,OpenAI仅从微软就获得了超过100亿美元的投资,而Anthropic从谷歌和亚马逊获得的资金,也高达60亿美元。 据《华尔街日报》报道,去年10月,谷歌承诺向Anthropic投资20亿美元 因此,此项合作一出,Mistral AI「欧洲版OpenAI」的名头,更加坐实了。 而对于微软来说,这项投资也是好处多多——这是它在欧洲AI领域站稳脚跟的机会。 本来,作为Azure云中欧盟服务器上OpenAI模型的唯一提供商,微软已经在欧洲的AI竞赛中处于领先地位。 不过AI在欧洲所受的待遇,并不像在美国那样备受支持。 欧洲许多国家对于AI的态度偏保守,他们持的是批判性的态度,尤其是在数据保护方面。 而如果是欧洲服务器商的欧洲AI模型,或许能让人放心,不失为一种不错的补救措施。 成立9个月的传奇AI初创企业,挑战硅谷巨头 Mistral在种子轮融资时「6人团队,7页PPT,8亿融资」的故事,值得好好讲一讲。 2023年初,还在谷歌工作的Arthur Mensch,刚刚30岁。 一年之后,他离开谷歌创立自己的公司,只用了9个来月的时间,就已经估值20亿美元! Mensch于2020年初加入了谷歌,成为DeepMind的研究员,他的研究方向是提高AI和机器学习系统的效率。那时他27岁。 后来,他和两位之前一起参与了Llama模型研发的年轻人Timothée Lacroix和Guillaume Lample一起,决定成立一家公司,通过更加高效的方法构建和部署AI模型。 他们相信,小团队能力在灵活性上超越硅谷的大公司,而开源模型就是他们实现这一目标的利器。 虽然已经从各路投资者那里筹集了超过5亿美元,他的公司Mistral AI相比于微软支持的OpenAI,谷歌,乃至Anthropic,依然显得有些「微不足道」。 这些巨头,以及巨头重金支持的巨型独角兽投入了几十亿美元来构建全世界最先进的AI系统。 但Mensch并不担心与这些庞然大物竞争。 「我们的目标是成为 AI 领域中最节省资本的公司,」Mensch表示。「这是我们成立的初衷。」 对于刚刚推出的Mistral Large模型,他认为,这款模型在执行某些推理任务上能够与OpenAI最先进的语言模型GPT-4和谷歌的新模型Gemini Ultra相匹敌。 Mensch透露,开发这款新模型的成本不到2000万欧元(约合2200万美元)。 Mistral巴黎总部的办公室 相比之下,OpenAI的首席执行官Sam Altman曾在去年发布GPT-4时表示,训练他们公司的大型模型的成本接近1亿美元。 而且随着他们用行业内最为高效的开源模型不断震惊业界,他们也获得了微软,英伟达和Salesforce等大公司的背书。 巨头们也通过现金或者算力的支持,获取了Mistral AI的少量股份。 伴随着Mistral Large的发布,9个月前他们用7页PPT吹下的牛,已经完全兑现了。 撬动8亿元投资的六人团队 这六个人的团队,是这样组成的。 Arthur Mensch在巴黎综合理工学院和巴黎高等师范学院学习期间,结识了另两位创始人——Timothée Lacroix和Guillaume Lample。 两人都是Meta AI团队的,Lample甚至领导了LLaMA的开发。 几个三十出头的年轻人,在LLM开发领域已经有不少经验。 在当时,即使在全世界范围内,具备构建、训练和优化LLM专业经验的人,也不超过100人。 而另外三位,分别是来自法国巴黎健康初创公司Alan的CEO Jean-Charles Samuelian和CTO Charles Gorintin,以及前法国数字事务国务秘书Cédric O。 AI科学家,如何创立自己的独角兽公司 Mensch个头高大,一头浓密的深色头发,他既不像典型的科技极客,也不像常见的CEO。 他的朋友和同事们说,他总是一边喝啤酒一边轻松地和朋友开玩笑。 作为一名运动爱好者,他在2018年提交博士论文前的几个月,以不到三小时半的时间跑完了巴黎马拉松。 Mensch从小就在学术追求与创业之间徘徊。他出生在巴黎西郊,母亲是物理老师,父亲拥有一家小型科技公司。 这位未来的CEO毕业于法国顶级的数学和机器学习院校。他的导师们将他描述为一个热情投入、能够迅速掌握自己几乎没有基础的项目的学生。 「我确实热爱探索新事物,」Mensch 表示。「我很容易感到厌倦。」 在攻读博士期间,Mensch的研究方向是优化软件,分析核磁共振图像(fMRI)系统的三维大脑图像,让软件能够处理高达数百万的图像量。 2020年底,Mensch加入了DeepMind,在那里他参与开发了大语言模型。 到了2022年,他以主要作者的身份发表了著名的「Chinchilla论文」。 这项研究重新定义了人们对AI模型的大小、训练它所需的数据量以及其性能之间关系的认识,被称为AI缩放法则。 随着2022年AI竞赛的升温,Mensch对于大公司的AI实验室减少了关于大语言模型研究成果的发表,减少了与研究社区的分享这一情况表示失望。 ChatGPT发布后,谷歌决定加速追赶。 Mensch所在的团队从一个10人的小团队变为30人,最后扩充成为了一个70人的大团队。 「我觉得我在事情变得过于官僚化之前应该离开了,」Mensch 说。「我不想在大型科技公司中开发那些不透明的技术。」 Mistral在2023年春天向投资者提出的最初方案中,批评了由美国公司主导的「正在形成的寡头垄断」,这些公司开发的是专有闭源模型。 对于Mensch和他的合伙人来说,将他们的初始AI系统作为开源软件发布,允许任何人免费使用或修改,这是一个重要的原则。 这也是吸引开发者和潜在客户的一种方式,他们希望每个人对自己使用的AI有更多的控制权。 尽管Mistral现在的最先进模型Mistral Large并不开源,但Mensch表示: 「在构建商业模式和坚持我们的开源价值观之间找到一个平衡点是非常微妙的。我们希望创造新的事物、新的架构,但是还想向我们的客户提供一些额外的产品和服务。」
基于ChatGPT API开发的Perplexity AI能够自动搜集、分析并展示来自互联网及其他数据源的相关信息,从而极大地优化了信息检索和知识获取的过程。
Eduwriter.ai
话炉
Paraphraser.io
快写兔
YesChat Ai
ChatAA
妙言妙语AI
FineTBot
AskNow AI
网站地图
冒充Sora生成的AI视频,已经成为营销号涨粉的流量密码
以下文章节选自丨APPSO
上周,是春节后开工的第一周。
全网都被Sora的热度刷屏了一周。各种讨论、争辩与割韭菜,不绝于耳。
这是AI生成的「威尔·史密斯吃意面」吗??
——并不是,这是他亲自实拍的Sora视频模仿秀。
虽然Sora还未对外开放,但互联网已经变得越来越荒诞。
AI越来越像真的,真人越来越热衷假冒AI。Sora能不能杀死好莱坞我不知道,但是先把我大脑干烧了。?
Sora稳定发挥的视频,我们或多或少都看过一部分,比如下面这个提示词为「考古学家在沙漠发现一把普通的塑料椅子,小心地挖掘并除尘」的AI视频。
这张椅子好像一个有想法的生物,不受牛顿理论的约束,还偷偷带走了一个人类。
光怪陆离的视频被分发到社交媒体,可能会打上这样的标签:#意识流、#超现实主义、#人类早期驯服野生椅子的珍贵视频…
针对这条视频,OpenAI认真地解释了为什么出现物理学的Bug:
「Sora未能将椅子建模为刚性物体,即外力作用下不改变形状和体积的物体,所以导致物理交互不准确。」
比如Sora生成的这个摔碎玻璃杯的视频,杯子并没有摔碎,液体像果冻一样粘连在一起,滑稽而又匪夷所思。
另外,还有倒着使用跑步机的健身者、怎么也吹不灭的生日蜡烛、凭空闪现的小狼、四只腿的蚂蚁?......
AI在不经意间,做出了人脑和特效都想不到的事。
Sora官宣以来,两派的AI技术大佬持续争论——它能否理解物理世界?
OpenAI始终不对外澄清这一点。
只是强调,Sora可以模拟现实世界中人、动物和环境的某些方面,但可能难以准确模拟复杂场景的物理原理,比如混淆左右、咬了饼干后没有咬痕。
但不妨碍OpenAI将Sora称之为「世界模拟器」。
外界普遍推测,Sora基于游戏引擎「虚幻5」打造,那的确可以实现以假乱真。
趁AI还未进化到完全态,不妨脑洞大开。还不稳定的AI视频,完全可以作为灵异、悬疑、恐怖、魔幻题材的素材库,为创作提供新的灵感,越要掀翻牛顿棺材板,表现得就越具艺术性。
尽管内容已经如此魔幻,还是有网友犹豫了一秒:「不露一帧Bug,我都怀疑它是实拍。」
哪怕是Sora的“翻车视频”,其时长、画质、稳定性也依然能够吊打Pika、Runway等业界「老前辈」。
当其他工具生成的视频不过3-4秒。Sora直接把这条赛道的门槛从保持单镜头稳定,直接往上拉至1分钟,还能实现多机位的无缝切换,相对准确地保持画面主体和视觉风格的一致,仿佛会用镜头语言和叙事节奏讲故事。
乍看之下,好像现场真的有摄像机跟拍,人、物体和场景都在三维空间里移动,同个角色还能有多个视角。
Sora可以实现多个视角还原日本街头的Sakura。?
2024年,AI生成影片实现从「动态图」到「视频」的飞跃。
对此,360董事长周鸿祎分享了一个很有意思的观点:
他认为,Sora工作原理像人类的做梦,我们会梦到奇奇怪怪的东西,但依据的是我们在生活中眼睛看到的东西、积累的经验,不用像电影工业那样3D建模然后一帧帧地渲染。?
从某个角度看,生成式AI确实像一台造梦机器,越来越接近人类的思维方式,用各种提示词有概率地制造合理或者不合理,不论对错,它一定会给你一个答案。
其实从ChatGPT开始,人们就想借着AI将梦境落地,小红书上有不少将梦境可视化的AI创作内容帖,虽然无法真正还原脑海的效果,却也将部分精神世界的幻影带入了现实。
看这两艘海盗船在咖啡杯里边激战,又是一个激动人心的杰克船长大战反派的故事。
“一败涂地”的人类,正在将模仿Sora当成流量密码
翻车视频之外,Sora的其他视频乍见惊艳,但也经不住放大镜式的审视。店铺招牌的乱码、猫的第五条腿、模特踏错的步伐......
虽然Sora还没有开放给公众使用,但卖课和卖显卡的人都赚钱了。
玩梗的乐子人在社交平台上发布视频时,只需要在文案当中加入「由Sora生成」几个字,然后编一段像模像样的提示词,就可以伪造一支AI制作的短片。
效果立竿见影,播放量直接拉满!
△滑冰爱好者伪造的“最伟大的灌篮”。
△一段游戏的录屏,也可以充当Sora生成的话题元素。
最让人真假难辨的当属宝莱坞电影,印度警匪片的情节和特效惊为天人。东方大国的想法太超前了,物理学早就不存在了,连AI都要向他们拜师学艺。
如果不是热心群众添加注释,附上11年前的一部印度电影YouTube地址,恐怕谁也不敢打包票这到底是人类创作还是AI生成。
以上并不是在故意玩梗…
这甚至引来了Netflix印度地区的官号也来蹭热度。
小编从印度「抗英神片」《RRR》截取一则片段伪装是Sora生成,发布到了推特(X)平台上,开头的这几秒实在太唬人了!
假冒AI视频整活,源自于Sora过人的视频拟真能力,远远超出普通人的知识储备。
混淆视听、自作自受,伤害可能还是人类自身,网友们开始担心,当AI生成和真人实拍真的傻傻分不清楚,自己没做过什么,却可能「证据确凿」。
悬疑英剧《真相捕捉》上演的情节:情报机关为了给罪犯定罪,伪造了监控录像。
他们认为,伪造监控录像,只是将窃听材料等非法证据,「重演」为合法证据,事情的确发生了,罪犯的确犯罪了。
技术无罪,但是谁也不知道使用技术的人是否别有用心。
甚至还有人通过熟识AI的Bug,反其道而行……
比如,因为AI不擅长画手,罪分子戴着假手指犯罪,看起来有六根手指,就可以污蔑监控画面由AI生成,且没法作为呈堂证供。
今天的AI,还远未能与人脑相匹敌。
AI创造的世界越接近现实,人类也就越容易假冒AI。
AI还没法主动作乱,打破信任的还得是人类自己。
AI还未必能模拟世界,但已经影响了我们看待世界的方式
最近,OpenAI开设TikTok(国际版抖音)账号,上传一批Sora的作品。
OpenAI为每一个视频都贴上标签「AI生成」。
OpenAI还在视频画面当中特别强调——由文生视频模型Sora生成。
观看者稍不注意,都会以为是实拍场景。
有AI技术的从业者认为,OpenAI目前在TikTok发布AI视频,可能是为了收集用户观看的数据反馈,对模型熟悉来自人类反馈的微调。
说不定,未来甚至会打造一个AI概念的TikTok。
事实上,目前已经存在24小时不间断播出内容的AI视频平台了,由Runway打造的RunwayTV。
未来,我们的观影体验也可能发生质的变化,不依赖于电影制作公司和流媒体,可以用大语言模型来决定自己想看的故事内容和演出阵容。
相比于Sora可以生成1分钟的高质量视频,在去年已经有不少剪辑大师利用Runway、Pika等视频生成工具打造电影级的预告片。
视频风格以快速剪辑为主,搭配旁白,注重节奏感和视觉冲击,也能构筑富有剧情的信息点。但缺少人物的对话和更复杂的场景展示。
未来,Sora可以创作一镜到底的AI视频,再用AI配音工具就能制作一则近乎完美的电影预告片。
△这是由Sora生成的美国西部淘金热的纪录片场景。
AI很擅长模仿现实世界的物理环境,比如火车车窗上的倒影,活脱脱就像一支Vlog。
2050年尼日利亚的城市风光,镜头从露天集市移动到都市天际线,不仔细看人物的细节,难以察觉个中的Bug。
对于那些旅游推广账号以及营销号作者,更是狂喜。已经没有购买大疆无人机的必要性了。
Sora可以通过提示词,直接制作某个旅游景点的鸟瞰图。
我们脑补的圣托里尼长什么样,AI就能给你模拟出来。
有网友笑称,如果将Sora+苹果Vision Pro结合起来,那将是最原始的《地球Online》模拟游戏。
Sora官方新闻稿页面直接提出「世界模拟器」的概念,某种程度上是把一切人类活动当作信息输入,汲取文字、图像、视频的养分,然后又输出信息,把文字变成绘画,把图片变成视频,仿佛《地球Online》的主宰。
这样的设定变为现实或许还要假以时日。
OpenAI自认的Sora代表作——这位行走在东京街头的女子,神态里边没有情感,感受不到人的气息。
真的很像《黑客帝国》里边的主角团,正在酝酿反抗数字生命的倒计时。
曾有网友表示,有没有一种可能,AI正在试图利用Bug来尝试伪装自己。?
AI参与感越来越强的未来,下次看到一个疑似的Bug,我们可能不会直接判断它是虚构的,会开始怀疑,AI是否别有用意?
未来已来,我们可能不喜欢,也得接受。
上一篇:Stability AI推出图像高清放大AI工具丨荣耀推出首款AI PC丨中兴发布自研AI大模型,并推出首款AI手机
冒充Sora生成的AI视频,已经成为营销号涨粉的流量密码
年后开工第一周,全网都被Sora的热度刷屏了一周。虽然Sora还未对外开放,但互联网已经变得越来越荒诞。AI越来越像真的,真人越来越热衷假冒AI。
Stability AI推出图像高清放大AI工具丨荣耀推出首款AI PC丨中兴发布自研AI大模型,并推出首款AI手机
【AI奇点网2024年2月27日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
最新开源大模型LWM发布丨与Sora一样能生成视频、图像,还能一次解读100万数据!
大语言模型(LLM)在生成文本内容方面非常强,但在理解、生成视频、图像等方面略显不足。尤其是在Sora一夜爆红之后,让人们意识到未来主流模型一定是文本+音频+图像+视频的多模态生成、理解功能。
全球首例AI侵犯知名IP形象宣判!广州法院判决AI生成奥特曼侵犯圆谷著作权
近日,广州互联网法院正式对外生效了一起关于生成式AI服务侵犯他人著作权判决,这也是全球范围内首例生成式AI服务侵犯他人著作权的生效判决。
Mistral AI最新公布_下一个OpenAI
成立9个月,当初那个「6人团队,7页PPT,8亿融资」的公司不断缔造传奇。Mistral AI今日发布的Mistral Large模型性能已经直逼GPT-4,同时和微软官宣合作。「下一个OpenAI」的爆相,已经越来越明显了。下一个OpenAI来了? 开源社区的另一个中心Mistral AI,刚刚发布了最强力的旗舰模型Mistral Large,性能直接对标GPT-4!(但可惜的是没有开源) Mistral Large具备卓越的逻辑推理能力,能够处理包括文本理解、转换以及代码生成在内的复杂多语言任务。 在众多主流基准测试中,Mistral Large力压Anthropic的Claude 2和谷歌的Gemini Pro,成绩仅次于GPT-4! LLM领域,格局再次改变。 同时,就在今天,AI圈又一重磅消息曝出:继OpenAI之后,微软将Mistral也纳入麾下! Mistral从诞生之初,就充满传奇的光环。成立4周,6人团队,7页PPT,8亿融资(1 05亿欧元),简直堪称爽文走进现实。 创始人Arthur Mensch是1993年出生的法国小伙,在谷歌工作3年后,在自己31岁时离开谷歌,拉拢了两位Llama模型的开发者,一起创立了这个日后可以和OpenAI、Anthropic分庭抗礼的公司。 几个人的团队,极少的融资,做出的模型却可以和GPT-4掰手腕。 如今再加上金主爸爸微软的撑腰,Mistral 「下一个OpenAI」的名头,是坐实了。 Mistral不开源?网友慌了! 现在,正处于全世界聚光灯下的Mistral,一举一动都十分引人注目。 有网友发现Mistral修改了网站内容,删除了所有提及开源社区义务的内容,这立马引发了恐慌! 之前的主页(左);现在的主页(右) 不过,大家目前还不需要太过担心。 根据外媒对Mistral CEO的采访,未来他们依然会坚持开源理念,但是同时也会推出性能最为强大的闭源模型参与商业竞争。 现在他们已经完成了以规模命名的开源模型:Mistral 7B和Mistral 8 x 7B回馈社区,以「大中小」命名的闭源模型赚钱的产品线搭建。 欧洲最强大模型来了! 话说回来,这次发布的Mistral Large,可以说是最适合欧洲人体质的大模型。 简单来说: - Mistral Large能够母语般流利地使用英语、法语、西班牙语、德语和意大利语,深刻理解各自的语法规则和文化背景。 - Mistral Large能够处理32K Token的上下文内容,使其能够从庞大的文档中精确快速地提取信息。 - Mistral Large在执行具体指令方面异常精准,这让开发人员可以根据自己的需求定制内容审查政策——例如,Mistral AI利用它来进行了le Chat的系统级别审查。 - Mistral Large原生支持函数调用。这个特性,结合Mistral AI在la Plateforme上实施的输出内容限制模式,极大地促进了应用程序的开发和技术栈的现代化。 目前,Mistral AI的这个新旗舰模型仅在Azure AI和Mistral AI平台上可用。 其中,在Azure AI上的定价如下:输出为0 024美元 1000 token,输入为0 008美元 1000 token。 推理能力与知识掌握 要说Mistral Large最令人印象深刻的,还是超强的推理能力。 作为旗舰模型,Mistral Large在常识、推理以及知识方面,都展现出了令人瞩目的实力。 虽然和GPT-4还有不小的差距,但Claude 2和Gemini Pro 1 0基本上已经是手下败将了。 多语言能力 作为一款欧洲人自己的大模型,Mistral Large在法语、德语、西班牙语和意大利语上的表现,均优于Llama 2 70B模型。 同时,也强过自家更小规模的模型。 数学与编程能力 在编程和数学方面,Mistral Large的能力也非常突出。 不仅相比自己其他模型有了大幅的提升,而且在主流的测试基准上都取得了不俗的成绩。 「小杯」也来了 相比之下,规模更小的Mistral Small,则更加专注于对延迟和成本的优化。 相较于Mixtral 8x7B,Mistral Small展现出更优异的性能和更低的延迟,是介于Mistral AI开源模型和旗舰模型之间的解决方案。 与Mistral Large类似,Mistral Small同样采用了在RAG和函数调用方面的创新技术。 此外,Mistral还优化了自家的服务接口: - 提供竞争力价格的开放权重端点,包括open-mistral-7B和open-mixtral-8x7b。 - 推出新的优化模型端点,包括mistral-small-2402和mistral-large-2402 同时继续提供未更新的mistral-medium。 和微软官宣合作,Mistral AI腰板更硬了 除了宣布模型之外,Mistral AI还官宣了和微软的深度合作。 而这也是微软继OpenAI之后,再次「真金白银」地入股AI圈的另一家顶流模型公司。 虽然2023年4月才成立,Mistral AI已经对欧洲的AI领域产生了重大影响。 开源模型Mistral 7B和Mixtral的发布,惊艳了一众开发者,在AI社区掀起了轩然大波。 如今微软的支持,让更多人坚信:Mistral就是下一个OpenAI。 Mistral AI是法国的AI初创公司,微软与它的合作,无疑让微软在欧洲也建立起了自己的AI影响力。 两家公司的合作,目标是弥补基础AI研究与实际解决方案之间的差距。 如果在未来建立多年的合作伙伴关系,Mistral AI就可以访问微软Azure的AI基础设施了。 微软的加持对Mistral AI意味着什么,不言而喻。 不光Mistral AI下一代LLM的开发和部署会大大加速,并且会开辟出新的商机。以欧洲为基础,Mistral AI会向全球市场扩张自己的影响力! 具体来说,微软和Mistral AI之间的合作集中在以下三个关键领域—— 超算基础结构:微软将通过Azure AI超算基础结构支持Mistral AI,用于AI训练和推理工作负载。 扩展市场:微软和Mistral AI将通过Azure AI Studio中的MaaS和Azure机器学习模型目录,向客户提供Mistral AI的高级模型。 AI研发:微软和Mistral AI将探索合作,为指定的客户开发专有模型,甚至包括欧洲公共部门的工作负载。 目前,两家公司还没有透露财务细节。 最近,Mistral AI以近20亿美元的估值,筹集了4 5亿欧元,由科技投资者Andreessen Horowitz领投。 不过,跟它在美国的竞争者比,Mistral AI所获得的资金显然并不算多。 要知道,OpenAI仅从微软就获得了超过100亿美元的投资,而Anthropic从谷歌和亚马逊获得的资金,也高达60亿美元。 据《华尔街日报》报道,去年10月,谷歌承诺向Anthropic投资20亿美元 因此,此项合作一出,Mistral AI「欧洲版OpenAI」的名头,更加坐实了。 而对于微软来说,这项投资也是好处多多——这是它在欧洲AI领域站稳脚跟的机会。 本来,作为Azure云中欧盟服务器上OpenAI模型的唯一提供商,微软已经在欧洲的AI竞赛中处于领先地位。 不过AI在欧洲所受的待遇,并不像在美国那样备受支持。 欧洲许多国家对于AI的态度偏保守,他们持的是批判性的态度,尤其是在数据保护方面。 而如果是欧洲服务器商的欧洲AI模型,或许能让人放心,不失为一种不错的补救措施。 成立9个月的传奇AI初创企业,挑战硅谷巨头 Mistral在种子轮融资时「6人团队,7页PPT,8亿融资」的故事,值得好好讲一讲。 2023年初,还在谷歌工作的Arthur Mensch,刚刚30岁。 一年之后,他离开谷歌创立自己的公司,只用了9个来月的时间,就已经估值20亿美元! Mensch于2020年初加入了谷歌,成为DeepMind的研究员,他的研究方向是提高AI和机器学习系统的效率。那时他27岁。 后来,他和两位之前一起参与了Llama模型研发的年轻人Timothée Lacroix和Guillaume Lample一起,决定成立一家公司,通过更加高效的方法构建和部署AI模型。 他们相信,小团队能力在灵活性上超越硅谷的大公司,而开源模型就是他们实现这一目标的利器。 虽然已经从各路投资者那里筹集了超过5亿美元,他的公司Mistral AI相比于微软支持的OpenAI,谷歌,乃至Anthropic,依然显得有些「微不足道」。 这些巨头,以及巨头重金支持的巨型独角兽投入了几十亿美元来构建全世界最先进的AI系统。 但Mensch并不担心与这些庞然大物竞争。 「我们的目标是成为 AI 领域中最节省资本的公司,」Mensch表示。「这是我们成立的初衷。」 对于刚刚推出的Mistral Large模型,他认为,这款模型在执行某些推理任务上能够与OpenAI最先进的语言模型GPT-4和谷歌的新模型Gemini Ultra相匹敌。 Mensch透露,开发这款新模型的成本不到2000万欧元(约合2200万美元)。 Mistral巴黎总部的办公室 相比之下,OpenAI的首席执行官Sam Altman曾在去年发布GPT-4时表示,训练他们公司的大型模型的成本接近1亿美元。 而且随着他们用行业内最为高效的开源模型不断震惊业界,他们也获得了微软,英伟达和Salesforce等大公司的背书。 巨头们也通过现金或者算力的支持,获取了Mistral AI的少量股份。 伴随着Mistral Large的发布,9个月前他们用7页PPT吹下的牛,已经完全兑现了。 撬动8亿元投资的六人团队 这六个人的团队,是这样组成的。 Arthur Mensch在巴黎综合理工学院和巴黎高等师范学院学习期间,结识了另两位创始人——Timothée Lacroix和Guillaume Lample。 两人都是Meta AI团队的,Lample甚至领导了LLaMA的开发。 几个三十出头的年轻人,在LLM开发领域已经有不少经验。 在当时,即使在全世界范围内,具备构建、训练和优化LLM专业经验的人,也不超过100人。 而另外三位,分别是来自法国巴黎健康初创公司Alan的CEO Jean-Charles Samuelian和CTO Charles Gorintin,以及前法国数字事务国务秘书Cédric O。 AI科学家,如何创立自己的独角兽公司 Mensch个头高大,一头浓密的深色头发,他既不像典型的科技极客,也不像常见的CEO。 他的朋友和同事们说,他总是一边喝啤酒一边轻松地和朋友开玩笑。 作为一名运动爱好者,他在2018年提交博士论文前的几个月,以不到三小时半的时间跑完了巴黎马拉松。 Mensch从小就在学术追求与创业之间徘徊。他出生在巴黎西郊,母亲是物理老师,父亲拥有一家小型科技公司。 这位未来的CEO毕业于法国顶级的数学和机器学习院校。他的导师们将他描述为一个热情投入、能够迅速掌握自己几乎没有基础的项目的学生。 「我确实热爱探索新事物,」Mensch 表示。「我很容易感到厌倦。」 在攻读博士期间,Mensch的研究方向是优化软件,分析核磁共振图像(fMRI)系统的三维大脑图像,让软件能够处理高达数百万的图像量。 2020年底,Mensch加入了DeepMind,在那里他参与开发了大语言模型。 到了2022年,他以主要作者的身份发表了著名的「Chinchilla论文」。 这项研究重新定义了人们对AI模型的大小、训练它所需的数据量以及其性能之间关系的认识,被称为AI缩放法则。 随着2022年AI竞赛的升温,Mensch对于大公司的AI实验室减少了关于大语言模型研究成果的发表,减少了与研究社区的分享这一情况表示失望。 ChatGPT发布后,谷歌决定加速追赶。 Mensch所在的团队从一个10人的小团队变为30人,最后扩充成为了一个70人的大团队。 「我觉得我在事情变得过于官僚化之前应该离开了,」Mensch 说。「我不想在大型科技公司中开发那些不透明的技术。」 Mistral在2023年春天向投资者提出的最初方案中,批评了由美国公司主导的「正在形成的寡头垄断」,这些公司开发的是专有闭源模型。 对于Mensch和他的合伙人来说,将他们的初始AI系统作为开源软件发布,允许任何人免费使用或修改,这是一个重要的原则。 这也是吸引开发者和潜在客户的一种方式,他们希望每个人对自己使用的AI有更多的控制权。 尽管Mistral现在的最先进模型Mistral Large并不开源,但Mensch表示: 「在构建商业模式和坚持我们的开源价值观之间找到一个平衡点是非常微妙的。我们希望创造新的事物、新的架构,但是还想向我们的客户提供一些额外的产品和服务。」
基于ChatGPT开发的AI搜索效率工具「Perplexity AI」,英伟达CEO黄仁勋爱不释手、用了又用
基于ChatGPT API开发的Perplexity AI能够自动搜集、分析并展示来自互联网及其他数据源的相关信息,从而极大地优化了信息检索和知识获取的过程。
Eduwriter.ai
话炉
Paraphraser.io
快写兔
YesChat Ai
ChatAA
妙言妙语AI
Eduwriter.ai
话炉
Paraphraser.io
快写兔
YesChat Ai
ChatAA
妙言妙语AI
FineTBot
AskNow AI