Midjourney角色一致性功能使用报告
MJ推出了新的'人物参考'功能,允许用户通过URL引用特定的人物图像来生成与之匹配的图像。使用时需在提示词后加入`--cref URL`,并可通过`--cw`调整参考强度。该功能适用于Midjourney图像制作的人物,但对真人照片可能产生扭曲。还可以混合多个URL来合成特征。
MJ终于出角色一致性了,虽然之前大家就用图片参考和插件换脸的方式尝试过很多路径,但是这次官方终于下场了,这篇文章我会用甜茶的图片为案例看看MJ这个超级重要的功能完成度有多高。(用甜茶的原因是刚看完沙丘,并且大家熟悉的明星用来测试如果特征匹配不够好,就会很明显的看出来)。
"人物参考"功能。这类似于"风格参考"功能,只是它不是匹配参考风格,而是尝试使人物与"人物参考"图像相匹配。
在你的提示后输入`--cref URL`并附上一个人物图像的URL
? 这里强调一下,一定要是提示词后面,我第一次没注意加在前面了,就报错了。
你可以使用`--cw`来修改参考'强度'从100到0
强度100(`--cw 100`)是默认值,它会使用面部、头发和衣服
老实说我觉得2和3是相对比较像甜茶的,但是也不是那么完美。衣服和发型确实跟参考图保持一致。
在强度0(`--cw 0`)时,它只会关注面部(适合改变服装/发型等)
该功能最适用于使用Midjourney图像制作的人物。它并非设计用于真人/照片(并且可能像常规图像提示一样对它们产生扭曲)
Cref的工作原理类似于常规图像提示,只是它"聚焦"于人物特征
这种技术的精度受到限制,它不会复制确切的酒窝/雀斑/或T恤标志。
Cref可用于Niji和普通MJ模型,并且还可以与`--sref`组合使用
下面是同样一张图片,用niji的二次元模型来生成。
这里我很自然的想到了,如果真实人物可以二次元化,那么二次元人物是否可以真人化。这个其实早就已经在SD上实现了,现在来测试一下MJ的能力。我这里用了EVA的零。
girl --cref https://s.mj.run/K5rsTVL19L4--v 6.0
当提示词信息很少的时候,图片的二次元风格很明显影响了画面的风格,不只是角色。
A short haired girl with blue short hair and red eyes, wearing an aviation suit ,Realistic character photography with advanced lighting --cref https://s.mj.run/K5rsTVL19L4--cw 100 --v 6.0
强制加上真实摄影相关的提示词后确实真实了,但是不是人物摄影,更像手办。
A short haired girl with blue short hair and red eyes, wearing an aviation suit ,Realistic character photography with advanced lighting --cref https://s.mj.run/K5rsTVL19L4--cw 0
图片权重降到最低之后,稍微真实一些了,但是人物完全不像了。
rei ayanami in scene of Evangelion, TSUNDERE, playful, bitchy, mocking, mean, cute, lovely, pale and blush, smiling with curl up corner of mouth, with the deepest sad in her eyes, realistic photography --cref https://s.mj.run/WeXSHXL9ef8
换了一组跟原动漫角色相关的提示词稍微好点了,但是还是有很强的塑料感。
你可以使用多个URL来混合来自多个图像的信息/人物,像这样`--cref URL1 URL2`(这类似于多个图像或风格提示)
这里的多个图片跟我想象的不太一样,如果上传多个人物就会混合他们的特征,看起来更像是他们的孩子,如果不能分别读取每个图像的特征,那么这个跟之前的图像参考区别并不大。我这里上传了一张甜茶和一张龙妈的照片,得出来的结果是既不像甜茶也不像龙妈。
将图像拖放或粘贴到输入框中,图片上就会有三个图标。选择这些图标可以设置它是图像提示、风格参考还是人物参考。按Shift并选择一个选项可以将一个图像用于多个类别。
这次的更新差不多可以给个7分吧,基本能用,但是没有那么惊艳。比可以结合controlnet的SD在可控性上差的还是挺大。但是胜在方便,以及MJ的核心竞争力画风优秀。
但是目前只能针对单个人物的一致性,多个人物的一致性尚待解决。
所以目前的这个功能可以解决部分的人物分镜一致性功能,另外的部分可以靠手动PS来补全。
0赞好文章,需要你的鼓励
推荐文章
阿里云第九代企业级ECS实例g9i不到150天服务超2万家客户,现在已有接近3万用户。
Queen's大学研究团队提出结构化智能体软件工程框架SASE,重新定义人机协作模式。该框架将程序员角色从代码编写者转变为AI团队指挥者,建立双向咨询机制和标准化文档系统,解决AI编程中的质量控制难题,为软件工程向智能化协作时代转型提供系统性解决方案。
苹果在iOS 26公开发布两周后推出首个修复更新iOS 26.0.1,建议所有用户安装。由于重大版本发布通常伴随漏洞,许多用户此前选择安装iOS 18.7。尽管iOS 26经过数月测试,但更大用户基数能发现更多问题。新版本与iPhone 17等新机型同期发布,测试范围此前受限。预计苹果将继续发布后续修复版本。
西北工业大学与中山大学合作开发了首个超声专用AI视觉语言模型EchoVLM,通过收集15家医院20万病例和147万超声图像,采用专家混合架构,实现了比通用AI模型准确率提升10分以上的突破。该系统能自动生成超声报告、进行诊断分析和回答专业问题,为医生提供智能辅助,推动医疗AI向专业化发展。