MJ终于出角色一致性了,虽然之前大家就用图片参考和插件换脸的方式尝试过很多路径,但是这次官方终于下场了,这篇文章我会用甜茶的图片为案例看看MJ这个超级重要的功能完成度有多高。
3月12日一早,Midjourney他们终于决定把万众期待的功能放出来了。风格一致性、角色一致性、场景一致性,三个能真正进入生产管线的极度重要的可控性功能。
预告了好久的MJ角色一致性功能终于来了, 新的命令“ --cref ”与 样式参考 “--sref”功能类似,但它不是匹配参考样式,而是尝试让角色匹配 "角色参考 "图像,--cref 目前只适用于 niji 6 和 v6 模型。
你要说这两个月,最火的大模型公司和最火的大模型应用是什么,那肯定是:月之暗面,和他们的Kimi。
文心一言的各方面能力,依然是国产大模型一哥,地位牢不可破。在领先优势方面,不仅仅是大模型的推理能力,还有产品运营层面的综合稳定考核。
可能有挺多人没听说过这个Kimi Chat,但是这次的测评却让我体会到了不一样的感受,不得不说,国产大模型也有厉害的啊!
从放出的Demo效果来看,Pika 1 0正式版不仅能根据文字图片,可编辑性还特别强,指定视频中的服饰元素,一句话就能实现快速“换装”。
阿里云发布代号为Qwen-72B的开源模型,在10个权威基准评测中刷新开源模型最优成绩。在部分测评得分还超过了闭源的GPT-3 5和GPT-4。
从PIKA爆火之后,AI视频项目开始井喷式爆发。不管是学术界的,还是产品界的,都像在人们的眼光聚焦在AI视频上时,来推出自己的东西。割韭菜的也有,但是学术真正牛逼的东西更多。有3个令我映像非常深刻,也在我群里和朋友圈里刷屏的三个项目
PIKA1 0全网爆火后。我作为PIKA的超级合作者,一直盼星星盼月亮,等他们的PIKA1 0 等啊等,等啊等,在内部渠道登记了我的邮箱后。又过了一天。终于。收到了来自PIKA的邮件。
谷歌双子座Gemini大模型终于发布!其中最引人注目的一张图,MMLU多任务语言理解数据集测试,Gemini Ultra不光超越GPT-4,甚至超越了人类专家。
当地时间12月7日,马斯克突然宣布旗下的Grok AI大模型向付费用户大批量开放了。根据官方介绍,Grok具有非常出色的幽默感,从实测来看的确如此。
针对Meta Imagine,Midjourney,Adobe Firefly,Dalle,这四个我心目中的比较大的AI绘图模型测评。我会从细节质量、审美(构图色彩等)、风格多样化、语义理解这四个维度来评测,每个维度3个Prompt,同时每个Prompt我会在AI绘图模型中roll3次,取效果最具有代表性的那个图,尽量减少偏见。
Pika 1 0正式上线后,拿到内测资格的网友们已经玩疯了!有人用它生成了一个姜黄色头发女孩和她的姜黄色猫的短片。以往,因为一致性的难题,用AI视频很难做出优秀的动漫作品。但是Pika 1 0 实在是太给人惊喜了!
虽然圣诞节已经临近,但谷歌还在卷个不停——号称对标DALL·E 3的最强竞品文生图模型——谷歌Imagen 2,终于重磅上线了。
有点意外,Midjourney猝不及防,北京时间下午13:56 老美那边大概夜里10点,发布了新版的V6 Beta模型。他们是想趁着还没回家过圣诞,赶紧先发了。然后让大家一边过圣诞,一边给他们打黑工帮他们测模型。这一下子给我发的,是着实的有点猝不及防。
兵贵神速,Midjourney V6昨天上午说要来,下午就真来了。神图纷纷炸出,光影效果登峰造极,主打一个「你能说我就能画」,擅长写Prompt的朋友,你们有福了!
在我过去的所有文章中,我一直把AI分成四个模态去进行分类:AI文本(大语言模型)、AI绘图、AI声音、AI视频,而在我最近的交流和访谈中,有一个游离于这四模态之外的存在,被反复提起。AI 3D。
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
字狐AIPPT
叮当好记 — ReadLecture
听脑AI
Stylized,快速拍出专业的产品照片
Hama - Image Editing
AI. Image Enlarger,图像质量提升
Resumaker.ai
Viesus Cloud---增强照片质量
Let's Enhance,图片质量提升
网站地图
MJ终于出角色一致性了,虽然之前大家就用图片参考和插件换脸的方式尝试过很多路径,但是这次官方终于下场了,这篇文章我会用甜茶的图片为案例看看MJ这个超级重要的功能完成度有多高。
3月12日一早,Midjourney他们终于决定把万众期待的功能放出来了。风格一致性、角色一致性、场景一致性,三个能真正进入生产管线的极度重要的可控性功能。
预告了好久的MJ角色一致性功能终于来了, 新的命令“ --cref ”与 样式参考 “--sref”功能类似,但它不是匹配参考样式,而是尝试让角色匹配 "角色参考 "图像,--cref 目前只适用于 niji 6 和 v6 模型。
你要说这两个月,最火的大模型公司和最火的大模型应用是什么,那肯定是:月之暗面,和他们的Kimi。
文心一言的各方面能力,依然是国产大模型一哥,地位牢不可破。在领先优势方面,不仅仅是大模型的推理能力,还有产品运营层面的综合稳定考核。
可能有挺多人没听说过这个Kimi Chat,但是这次的测评却让我体会到了不一样的感受,不得不说,国产大模型也有厉害的啊!
从放出的Demo效果来看,Pika 1 0正式版不仅能根据文字图片,可编辑性还特别强,指定视频中的服饰元素,一句话就能实现快速“换装”。
阿里云发布代号为Qwen-72B的开源模型,在10个权威基准评测中刷新开源模型最优成绩。在部分测评得分还超过了闭源的GPT-3 5和GPT-4。
从PIKA爆火之后,AI视频项目开始井喷式爆发。不管是学术界的,还是产品界的,都像在人们的眼光聚焦在AI视频上时,来推出自己的东西。割韭菜的也有,但是学术真正牛逼的东西更多。有3个令我映像非常深刻,也在我群里和朋友圈里刷屏的三个项目
PIKA1 0全网爆火后。我作为PIKA的超级合作者,一直盼星星盼月亮,等他们的PIKA1 0 等啊等,等啊等,在内部渠道登记了我的邮箱后。又过了一天。终于。收到了来自PIKA的邮件。
谷歌双子座Gemini大模型终于发布!其中最引人注目的一张图,MMLU多任务语言理解数据集测试,Gemini Ultra不光超越GPT-4,甚至超越了人类专家。
当地时间12月7日,马斯克突然宣布旗下的Grok AI大模型向付费用户大批量开放了。根据官方介绍,Grok具有非常出色的幽默感,从实测来看的确如此。
针对Meta Imagine,Midjourney,Adobe Firefly,Dalle,这四个我心目中的比较大的AI绘图模型测评。我会从细节质量、审美(构图色彩等)、风格多样化、语义理解这四个维度来评测,每个维度3个Prompt,同时每个Prompt我会在AI绘图模型中roll3次,取效果最具有代表性的那个图,尽量减少偏见。
Pika 1 0正式上线后,拿到内测资格的网友们已经玩疯了!有人用它生成了一个姜黄色头发女孩和她的姜黄色猫的短片。以往,因为一致性的难题,用AI视频很难做出优秀的动漫作品。但是Pika 1 0 实在是太给人惊喜了!
虽然圣诞节已经临近,但谷歌还在卷个不停——号称对标DALL·E 3的最强竞品文生图模型——谷歌Imagen 2,终于重磅上线了。
有点意外,Midjourney猝不及防,北京时间下午13:56 老美那边大概夜里10点,发布了新版的V6 Beta模型。他们是想趁着还没回家过圣诞,赶紧先发了。然后让大家一边过圣诞,一边给他们打黑工帮他们测模型。这一下子给我发的,是着实的有点猝不及防。
兵贵神速,Midjourney V6昨天上午说要来,下午就真来了。神图纷纷炸出,光影效果登峰造极,主打一个「你能说我就能画」,擅长写Prompt的朋友,你们有福了!
在我过去的所有文章中,我一直把AI分成四个模态去进行分类:AI文本(大语言模型)、AI绘图、AI声音、AI视频,而在我最近的交流和访谈中,有一个游离于这四模态之外的存在,被反复提起。AI 3D。
兵马俑跳《科目三》,是我万万没想到的。有人借助了阿里云之前走红的AI视频生成技术——「Animate Anyone」,生成出来了这个舞蹈片段。
字狐AIPPT
智能工具叮当好记 — ReadLecture
AI一键换脸听脑AI
AI一键换脸Stylized,快速拍出专业的产品照片
AI扩图Hama - Image Editing
AI扩图AI. Image Enlarger,图像质量提升
AI扩图Resumaker.ai
AI扩图Viesus Cloud---增强照片质量
AI扩图Let's Enhance,图片质量提升
AI扩图