Midjourney角色一致性功能使用报告
MJ推出了新的'人物参考'功能,允许用户通过URL引用特定的人物图像来生成与之匹配的图像。使用时需在提示词后加入`--cref URL`,并可通过`--cw`调整参考强度。该功能适用于Midjourney图像制作的人物,但对真人照片可能产生扭曲。还可以混合多个URL来合成特征。
MJ终于出角色一致性了,虽然之前大家就用图片参考和插件换脸的方式尝试过很多路径,但是这次官方终于下场了,这篇文章我会用甜茶的图片为案例看看MJ这个超级重要的功能完成度有多高。(用甜茶的原因是刚看完沙丘,并且大家熟悉的明星用来测试如果特征匹配不够好,就会很明显的看出来)。
"人物参考"功能。这类似于"风格参考"功能,只是它不是匹配参考风格,而是尝试使人物与"人物参考"图像相匹配。
在你的提示后输入`--cref URL`并附上一个人物图像的URL
? 这里强调一下,一定要是提示词后面,我第一次没注意加在前面了,就报错了。
你可以使用`--cw`来修改参考'强度'从100到0
强度100(`--cw 100`)是默认值,它会使用面部、头发和衣服
老实说我觉得2和3是相对比较像甜茶的,但是也不是那么完美。衣服和发型确实跟参考图保持一致。
在强度0(`--cw 0`)时,它只会关注面部(适合改变服装/发型等)
该功能最适用于使用Midjourney图像制作的人物。它并非设计用于真人/照片(并且可能像常规图像提示一样对它们产生扭曲)
Cref的工作原理类似于常规图像提示,只是它"聚焦"于人物特征
这种技术的精度受到限制,它不会复制确切的酒窝/雀斑/或T恤标志。
Cref可用于Niji和普通MJ模型,并且还可以与`--sref`组合使用
下面是同样一张图片,用niji的二次元模型来生成。
这里我很自然的想到了,如果真实人物可以二次元化,那么二次元人物是否可以真人化。这个其实早就已经在SD上实现了,现在来测试一下MJ的能力。我这里用了EVA的零。
girl --cref https://s.mj.run/K5rsTVL19L4--v 6.0
当提示词信息很少的时候,图片的二次元风格很明显影响了画面的风格,不只是角色。
A short haired girl with blue short hair and red eyes, wearing an aviation suit ,Realistic character photography with advanced lighting --cref https://s.mj.run/K5rsTVL19L4--cw 100 --v 6.0
强制加上真实摄影相关的提示词后确实真实了,但是不是人物摄影,更像手办。
A short haired girl with blue short hair and red eyes, wearing an aviation suit ,Realistic character photography with advanced lighting --cref https://s.mj.run/K5rsTVL19L4--cw 0
图片权重降到最低之后,稍微真实一些了,但是人物完全不像了。
rei ayanami in scene of Evangelion, TSUNDERE, playful, bitchy, mocking, mean, cute, lovely, pale and blush, smiling with curl up corner of mouth, with the deepest sad in her eyes, realistic photography --cref https://s.mj.run/WeXSHXL9ef8
换了一组跟原动漫角色相关的提示词稍微好点了,但是还是有很强的塑料感。
你可以使用多个URL来混合来自多个图像的信息/人物,像这样`--cref URL1 URL2`(这类似于多个图像或风格提示)
这里的多个图片跟我想象的不太一样,如果上传多个人物就会混合他们的特征,看起来更像是他们的孩子,如果不能分别读取每个图像的特征,那么这个跟之前的图像参考区别并不大。我这里上传了一张甜茶和一张龙妈的照片,得出来的结果是既不像甜茶也不像龙妈。
将图像拖放或粘贴到输入框中,图片上就会有三个图标。选择这些图标可以设置它是图像提示、风格参考还是人物参考。按Shift并选择一个选项可以将一个图像用于多个类别。
这次的更新差不多可以给个7分吧,基本能用,但是没有那么惊艳。比可以结合controlnet的SD在可控性上差的还是挺大。但是胜在方便,以及MJ的核心竞争力画风优秀。
但是目前只能针对单个人物的一致性,多个人物的一致性尚待解决。
所以目前的这个功能可以解决部分的人物分镜一致性功能,另外的部分可以靠手动PS来补全。
0赞好文章,需要你的鼓励
推荐文章
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。