Midjourney角色一致性功能使用报告
MJ推出了新的'人物参考'功能,允许用户通过URL引用特定的人物图像来生成与之匹配的图像。使用时需在提示词后加入`--cref URL`,并可通过`--cw`调整参考强度。该功能适用于Midjourney图像制作的人物,但对真人照片可能产生扭曲。还可以混合多个URL来合成特征。
MJ终于出角色一致性了,虽然之前大家就用图片参考和插件换脸的方式尝试过很多路径,但是这次官方终于下场了,这篇文章我会用甜茶的图片为案例看看MJ这个超级重要的功能完成度有多高。(用甜茶的原因是刚看完沙丘,并且大家熟悉的明星用来测试如果特征匹配不够好,就会很明显的看出来)。
"人物参考"功能。这类似于"风格参考"功能,只是它不是匹配参考风格,而是尝试使人物与"人物参考"图像相匹配。
在你的提示后输入`--cref URL`并附上一个人物图像的URL
? 这里强调一下,一定要是提示词后面,我第一次没注意加在前面了,就报错了。
你可以使用`--cw`来修改参考'强度'从100到0
强度100(`--cw 100`)是默认值,它会使用面部、头发和衣服
老实说我觉得2和3是相对比较像甜茶的,但是也不是那么完美。衣服和发型确实跟参考图保持一致。
在强度0(`--cw 0`)时,它只会关注面部(适合改变服装/发型等)
该功能最适用于使用Midjourney图像制作的人物。它并非设计用于真人/照片(并且可能像常规图像提示一样对它们产生扭曲)
Cref的工作原理类似于常规图像提示,只是它"聚焦"于人物特征
这种技术的精度受到限制,它不会复制确切的酒窝/雀斑/或T恤标志。
Cref可用于Niji和普通MJ模型,并且还可以与`--sref`组合使用
下面是同样一张图片,用niji的二次元模型来生成。
这里我很自然的想到了,如果真实人物可以二次元化,那么二次元人物是否可以真人化。这个其实早就已经在SD上实现了,现在来测试一下MJ的能力。我这里用了EVA的零。
girl --cref https://s.mj.run/K5rsTVL19L4--v 6.0
当提示词信息很少的时候,图片的二次元风格很明显影响了画面的风格,不只是角色。
A short haired girl with blue short hair and red eyes, wearing an aviation suit ,Realistic character photography with advanced lighting --cref https://s.mj.run/K5rsTVL19L4--cw 100 --v 6.0
强制加上真实摄影相关的提示词后确实真实了,但是不是人物摄影,更像手办。
A short haired girl with blue short hair and red eyes, wearing an aviation suit ,Realistic character photography with advanced lighting --cref https://s.mj.run/K5rsTVL19L4--cw 0
图片权重降到最低之后,稍微真实一些了,但是人物完全不像了。
rei ayanami in scene of Evangelion, TSUNDERE, playful, bitchy, mocking, mean, cute, lovely, pale and blush, smiling with curl up corner of mouth, with the deepest sad in her eyes, realistic photography --cref https://s.mj.run/WeXSHXL9ef8
换了一组跟原动漫角色相关的提示词稍微好点了,但是还是有很强的塑料感。
你可以使用多个URL来混合来自多个图像的信息/人物,像这样`--cref URL1 URL2`(这类似于多个图像或风格提示)
这里的多个图片跟我想象的不太一样,如果上传多个人物就会混合他们的特征,看起来更像是他们的孩子,如果不能分别读取每个图像的特征,那么这个跟之前的图像参考区别并不大。我这里上传了一张甜茶和一张龙妈的照片,得出来的结果是既不像甜茶也不像龙妈。
将图像拖放或粘贴到输入框中,图片上就会有三个图标。选择这些图标可以设置它是图像提示、风格参考还是人物参考。按Shift并选择一个选项可以将一个图像用于多个类别。
这次的更新差不多可以给个7分吧,基本能用,但是没有那么惊艳。比可以结合controlnet的SD在可控性上差的还是挺大。但是胜在方便,以及MJ的核心竞争力画风优秀。
但是目前只能针对单个人物的一致性,多个人物的一致性尚待解决。
所以目前的这个功能可以解决部分的人物分镜一致性功能,另外的部分可以靠手动PS来补全。
0赞好文章,需要你的鼓励
推荐文章
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
哈佛、MIT联合研究揭示人类语言理解的神经机制,发现大脑通过"信息出口"将语言从核心系统传递至专业脑区实现深度理解。研究提出浅层与深层理解的区别,为人工智能发展提供重要启示,表明真正智能需要多系统协作而非单一优化。该发现可能改变我们对语言认知的理解。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
腾讯混元等团队开发出革命性的AI视频生成自我评判系统PAVRM和训练方法PRFL,让AI能在创作过程中实时评估和改进视频质量,无需等到完成才反馈。该技术使视频动态表现提升56%,人体结构准确性提升21.5%,训练效率提升1.4倍,为AI视频生成质量带来质的飞跃。