从PIKA爆火之后,AI视频项目开始井喷式爆发。
不管是学术界的,还是产品界的,都像在人们的眼光聚焦在AI视频上时,来推出自己的东西。
割韭菜的也有,但是学术真正**的东西更多。
有3个令我映像非常深刻,也在我群里和朋友圈里刷屏的三个项目:
阿里的Animate Anyone
字节跳动的MagicAnimate
微软的GAIA
字节和阿里都是AI动画的项目,纯竞品,后面细说。微软的GAIA是照片说话。
一个一个说:
阿里研究院上周四出的一个AI动画项目,一张人物静态图+一个骨骼动画,就能生成一段人物的动画。
这玩意我直接放图吧,放图比文字来的直观。
我甚至都不用文字描述太多,应该都能看出来对动漫、影视、游戏领域冲击有多大吧?
特别是最后一个图。正常来说,你想做一个3维人物的动作,是需要绑骨骼、刷权重的,一堆恶心活。现在你直接拉个骨骼K个帧,渲一张人物的T-pose静态图,AI一下,啪,完事了。。。
你可以想象到对这些行业的降本增效有多大?
而且,Animate Anyone在人物的一致性和画面的稳定性上,表现极佳。
应该能看出来,这稳定性就挺离谱的。
但是。注意,但是来了。
阿里他吧。。。不提供项目demo也不提供代码。。。
他总是这样,甩了个宣传出来。。。然后就没有然后了。。。
所以虽然刷屏了,但是也就看看得了,有兴趣的可以收藏一下他们的Github,没事跟踪一下。万一这货出产品了呢?
地址:https://github.com/HumanAIGC/AnimateAnyone
你看这名字,你都能看出来,是Animate Anyone的竞品了吧?
而且这玩意最骚的一点在于:
他,放,demo,了!
对你没看错,他放demo和代码了!
字节打阿里,哎你放宣传片是吧,那我就让大家直接上手用,哎我就恶心你。
当然享福的那肯定就是用户了。
说实话,这玩意效果也挺离谱的。
支持多人,但是咋说呢,面部和手部问题挺大,效果不如阿里的AnimateAnyone。
再放一点网友的整活:
优点就是代码放出来了,可能会有大佬去魔改,同时可以体验。
Kohya Tech是这么评价阿里和字节的这两个项目的:
笑。
MagicAnimate的地址:
Huggingface上的在线测试地址:https://huggingface.co/spaces/zcxu-eric/magicanimate
上周五的一个相当惊喜的项目,类似奇妙元、Heygen、D-ID,让“照片说话”的东西。
但是整体效果非常惊艳。直接放图。
比如直接照片+语音驱动。
然后是直接照片+视频驱动。
他们还支持控制头部,通过用手工制作的姿势或从另一个视频中提取的姿势来控制头部姿势吗,同时嘴唇运动与语音内容同步。
接下来是最*的部分,他居然支持文字生成脸部情绪!
比如“悲伤”、“张开嘴”或“惊讶”等文字提示来指导视频生成。
悲伤:
惊喜:
相当离谱的效果。你可以想象一下,以后再影视、短剧等等的应用场景里面,这种技术会有多离谱的应用。
当然,还有诈骗。
这是我目前看到的最**效果最好的照片说话项目。但跟阿里一样,目前弊端就是:非公开。
但是在项目的主页上也写了:Code (Coming Soon),也就是代码即将推出。估计很快就能试用了。
项目地址:https://microsoft.github.io/GAIA/
写在最后
作为一名AI发烧友和创作者。
这应该是第一次看到AI视频类项目极其密集的喷涌而出,逐渐接近的未来,正在加速。
一天一变,这真不是空话。
你看AI,才能感受到,这个行业变化的有多块。
相连的未来,那个疯狂的未来,你已经能看见一些雏形了。
不要被时代甩下。
然后重返过去。
多看看,也并没有什么坏处。
上一篇:pika最新评测_pika全网首发评测_pika地址
下一篇:阿里云发布国产首个720亿参数大模型_免费开源!第一手实测在此
【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。
据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。
Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。
飞书智能伙伴
必剪
Hi Echo — 网易有道
堆友
360AI搜索
Wink Studio
通义效率
360AI助手
腾讯文档AI
网站地图
AI视频项目测评_Animate Anyone怎么使用_Animate Anyone项目开源代码
从PIKA爆火之后,AI视频项目开始井喷式爆发。
不管是学术界的,还是产品界的,都像在人们的眼光聚焦在AI视频上时,来推出自己的东西。
割韭菜的也有,但是学术真正**的东西更多。
有3个令我映像非常深刻,也在我群里和朋友圈里刷屏的三个项目:
阿里的Animate Anyone
字节跳动的MagicAnimate
微软的GAIA
字节和阿里都是AI动画的项目,纯竞品,后面细说。微软的GAIA是照片说话。
一个一个说:
一. 阿里Animate Anyone
阿里研究院上周四出的一个AI动画项目,一张人物静态图+一个骨骼动画,就能生成一段人物的动画。
这玩意我直接放图吧,放图比文字来的直观。
我甚至都不用文字描述太多,应该都能看出来对动漫、影视、游戏领域冲击有多大吧?
特别是最后一个图。正常来说,你想做一个3维人物的动作,是需要绑骨骼、刷权重的,一堆恶心活。现在你直接拉个骨骼K个帧,渲一张人物的T-pose静态图,AI一下,啪,完事了。。。
你可以想象到对这些行业的降本增效有多大?
而且,Animate Anyone在人物的一致性和画面的稳定性上,表现极佳。
应该能看出来,这稳定性就挺离谱的。
但是。注意,但是来了。
阿里他吧。。。不提供项目demo也不提供代码。。。
他总是这样,甩了个宣传出来。。。然后就没有然后了。。。
所以虽然刷屏了,但是也就看看得了,有兴趣的可以收藏一下他们的Github,没事跟踪一下。万一这货出产品了呢?
地址:https://github.com/HumanAIGC/AnimateAnyone
二. 字节MagicAnimate
你看这名字,你都能看出来,是Animate Anyone的竞品了吧?
而且这玩意最骚的一点在于:
他,放,demo,了!
对你没看错,他放demo和代码了!
字节打阿里,哎你放宣传片是吧,那我就让大家直接上手用,哎我就恶心你。
当然享福的那肯定就是用户了。
说实话,这玩意效果也挺离谱的。
支持多人,但是咋说呢,面部和手部问题挺大,效果不如阿里的AnimateAnyone。
再放一点网友的整活:
优点就是代码放出来了,可能会有大佬去魔改,同时可以体验。
Kohya Tech是这么评价阿里和字节的这两个项目的:
笑。
MagicAnimate的地址:
Huggingface上的在线测试地址:https://huggingface.co/spaces/zcxu-eric/magicanimate
三. 微软GAIA
上周五的一个相当惊喜的项目,类似奇妙元、Heygen、D-ID,让“照片说话”的东西。
但是整体效果非常惊艳。直接放图。
比如直接照片+语音驱动。
然后是直接照片+视频驱动。
他们还支持控制头部,通过用手工制作的姿势或从另一个视频中提取的姿势来控制头部姿势吗,同时嘴唇运动与语音内容同步。
接下来是最*的部分,他居然支持文字生成脸部情绪!
比如“悲伤”、“张开嘴”或“惊讶”等文字提示来指导视频生成。
悲伤:
惊喜:
相当离谱的效果。你可以想象一下,以后再影视、短剧等等的应用场景里面,这种技术会有多离谱的应用。
当然,还有诈骗。
这是我目前看到的最**效果最好的照片说话项目。但跟阿里一样,目前弊端就是:非公开。
但是在项目的主页上也写了:Code (Coming Soon),也就是代码即将推出。估计很快就能试用了。
项目地址:https://microsoft.github.io/GAIA/
写在最后
作为一名AI发烧友和创作者。
这应该是第一次看到AI视频类项目极其密集的喷涌而出,逐渐接近的未来,正在加速。
一天一变,这真不是空话。
你看AI,才能感受到,这个行业变化的有多块。
相连的未来,那个疯狂的未来,你已经能看见一些雏形了。
不要被时代甩下。
然后重返过去。
多看看,也并没有什么坏处。
上一篇:pika最新评测_pika全网首发评测_pika地址
下一篇:阿里云发布国产首个720亿参数大模型_免费开源!第一手实测在此
小度全新AI硬件将于百度世界大会发布丨智谱AI、即梦AI上线新一代视频生成模型丨OpenAI安全系统团队负责人离职
【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁
【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
李彦宏:文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布,搭载大模型边走边问
【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。
巧妙利用这两个AI产品,让你的国庆出行没有废片
这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。
OpenAI初步谈妥融资70亿美元:最大金主微软追加投资10亿,苹果退出
据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。
详解Meta全新大模型Llama 3.2系列:多模态视觉识别能力媲美OpenAI GPT-4o
Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。
飞书智能伙伴
必剪
Hi Echo — 网易有道
堆友
360AI搜索
Wink Studio
通义效率
飞书智能伙伴
必剪
Hi Echo — 网易有道
堆友
360AI搜索
Wink Studio
通义效率
360AI助手
腾讯文档AI