Midjourney角色一致性测评体验丨使用场景探讨

2024-12-13 来源|AI图库吧

MJ终于出角色一致性了,虽然之前大家就用图片参考和插件换脸的方式尝试过很多路径,但是这次官方终于下场了,这篇文章我会用甜茶的图片为案例看看MJ这个超级重要的功能完成度有多高。(用甜茶的原因是刚看完沙丘,并且大家熟悉的明星用来测试如果特征匹配不够好,就会很明显的看出来)。

"人物参考"功能。这类似于"风格参考"功能,只是它不是匹配参考风格,而是尝试使人物与"人物参考"图像相匹配。

如何使用

在你的提示后输入`--cref URL`并附上一个人物图像的URL

⚠️ 这里强调一下,一定要是提示词后面,我第一次没注意加在前面了,就报错了。

你可以使用`--cw`来修改参考"强度"从100到0

强度100(`--cw 100`)是默认值,它会使用面部、头发和衣服

老实说我觉得2和3是相对比较像甜茶的,但是也不是那么完美。衣服和发型确实跟参考图保持一致。

在强度0(`--cw 0`)时,它只会关注面部(适合改变服装/发型等)

发型有些许的变化,虽然都是卷发,然后衣服变了。

设计用途

该功能最适用于使用Midjourney图像制作的人物。它并非设计用于真人/照片(并且可能像常规图像提示一样对它们产生扭曲)

Cref的工作原理类似于常规图像提示,只是它"聚焦"于人物特征

这种技术的精度受到限制,它不会复制确切的酒窝/雀斑/或T恤标志。

Cref可用于Niji和普通MJ模型,并且还可以与`--sref`组合使用

下面是同样一张图片,用niji的二次元模型来生成。

这里我很自然的想到了,如果真实人物可以二次元化,那么二次元人物是否可以真人化。这个其实早就已经在SD上实现了,现在来测试一下MJ的能力。我这里用了EVA的零。

girl --cref https://s.mj.run/K5rsTVL19L4--v 6.0

当提示词信息很少的时候,图片的二次元风格很明显影响了画面的风格,不只是角色。

A short haired girl with blue short hair and red eyes, wearing an aviation suit ,Realistic character photography with advanced lighting --cref https://s.mj.run/K5rsTVL19L4--cw 100 --v 6.0

强制加上真实摄影相关的提示词后确实真实了,但是不是人物摄影,更像手办。

A short haired girl with blue short hair and red eyes, wearing an aviation suit ,Realistic character photography with advanced lighting --cref https://s.mj.run/K5rsTVL19L4--cw 0

图片权重降到最低之后,稍微真实一些了,但是人物完全不像了。

rei ayanami in scene of Evangelion, TSUNDERE, playful, bitchy, mocking, mean, cute, lovely, pale and blush, smiling with curl up corner of mouth, with the deepest sad in her eyes, realistic photography --cref https://s.mj.run/WeXSHXL9ef8

换了一组跟原动漫角色相关的提示词稍微好点了,但是还是有很强的塑料感。

高级功能

你可以使用多个URL来混合来自多个图像的信息/人物,像这样`--cref URL1 URL2`(这类似于多个图像或风格提示)

这里的多个图片跟我想象的不太一样,如果上传多个人物就会混合他们的特征,看起来更像是他们的孩子,如果不能分别读取每个图像的特征,那么这个跟之前的图像参考区别并不大。我这里上传了一张甜茶和一张龙**照片,得出来的结果是既不像甜茶也不像龙妈。

这个高级功能没太看懂高级在哪里。

在网页alpha版本上如何使用?

将图像拖放或粘贴到输入框中,图片上就会有三个图标。选择这些图标可以设置它是图像提示、风格参考还是人物参考。按Shift并选择一个选项可以将一个图像用于多个类别。

总结一下

这次的更新差不多可以给个7分吧,基本能用,但是没有那么惊艳。比可以结合controlnet的SD在可控性上差的还是挺大。但是胜在方便,以及MJ的核心竞争力画风优秀。

但是目前只能针对单个人物的一致性,多个人物的一致性尚待解决。

所以目前的这个功能可以解决部分的人物分镜一致性功能,另外的部分可以靠手动PS来补全。

一些想到的应用场景:

AI视频的一致性分镜

AI漫画的一致性分镜

AI摄影的人物摄影

游戏或者动漫的角色设计

最新
更多

小度全新AI硬件将于百度世界大会发布丨智谱AI、即梦AI上线新一代视频生成模型丨OpenAI安全系统团队负责人离职

【AI奇点网2024年11月11日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

字节跳动内测豆包通用图像编辑模型SeedEdit丨Grok聊天机器人免费版内测丨月之暗面Kimi创始人被提起仲裁

【AI奇点网2024年11月12日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

李彦宏:文心大模型日调用量超15亿丨百度发布文心「iRAG」文生图技术丨小度AI智能眼镜发布,搭载大模型边走边问

【AI奇点网2024年11月13日早报】本站每日播报AI业界最新资讯,触摸时代脉搏,掌握未来科技动向。事不宜迟,点击查看今日AI资讯早餐。

巧妙利用这两个AI产品,让你的国庆出行没有废片

这两天就有朋友来问我,有没有那种能修图的AI,就是扩图+消除啥的傻瓜好用的。大家大概的需求总结一下其实就两,AI消除+AI扩图。

OpenAI初步谈妥融资70亿美元:最大金主微软追加投资10亿,苹果退出

据华尔街日报报道,苹果公司退出了对 OpenAI 的新一轮融资谈判,而微软则计划向 OpenAI 追加约 10 亿美元的投资。

详解Meta全新大模型Llama 3.2系列:多模态视觉识别能力媲美OpenAI GPT-4o

Meta公司推出了Llama 3 2,也是它首款能够理解图像和文本的旗舰视觉模型。包含中型和小型两个版本,以及更轻量化可用于手机端侧的纯文本模型。

网站地图