在生成式 AI时代,Adobe为Photoshop核心的图像合成功能带来了革命性升级。Harmonize作为Photoshop最新的测试版功能,以图像协调处理过程命名,该工具能够帮助用户将图像无缝融合到项目中,通过自然混合的方式将对象融入背景。
该工具使用AI技术创建新的光照环境,包括色彩和阴影的调整。只需点击一下Harmonize按钮,Photoshop就会创建一个不可见的图层并将其应用到图像上,使其与项目的其他部分几乎完美融合,而不会破坏任何一张原始图像。前后对比效果显著,旨在将原本繁琐、需要注重细节的编辑过程缩短到几分钟内。
在去年秋季Adobe Max创作者大会上,Photoshop用户首次看到了这一仍处于研究概念阶段的工具。Adobe应用研究科学家Mengwei Ren作为该项目的主要工程师之一,分享了这个工具对Photoshop用户的巨大潜力。在观众的"非常震惊"的积极反应后,她和Photoshop团队致力于完善该工具。现在发布的测试版工具是多年机器学习和图像工作的成果。
Ren表示:"我们尝试用不同的方法来解决这个问题。我们最初只是尝试对人脸进行重新照明,然后我们还尝试了一个单独的模型来只添加阴影。在某个时候,因为生成式 AI技术真正在发展,我们开始大胆思考,'好吧,我们真的能把这些整合到一个统一的模型中吗?'"
自Max大会以来,团队已经增强了该工具的分辨率以获得更高质量的输出,创建了更精确的控件来为用户提供像素级对齐,并扩展了训练数据集以帮助工具为任何图像创建准确的光照条件。根据Adobe的AI用户指导原则和条款,该公司不会使用客户内容进行训练,其模型是基于授权内容训练的,包括Adobe Stock和公共领域内容。
Photoshop产品管理高级总监Stephen Nielsen表示,更快、更流畅的合成是Adobe团队近十年来一直在努力的方向。AI时代之前改进选择和背景移除工具的工作为Harmonize奠定了基础。生成式 AI技术帮助将拼图的所有不同部分组合在一起,使人们能够快速使用。
Nielsen说:"人们经常谈论某些东西被'粗糙地Photoshop处理',其中很大一部分与你如何很好地匹配光照、色调和阴影有关。这使得实现真正好的合成变得更快、更高效、更容易。"
像任何测试版工具一样,特别是涉及AI的工具,Harmonize并不完美。未来的工作将专注于在处理更复杂对象(如人脸)时保持更高的质量水平。保持面部身份是"最难解决的事情",Nielsen说,这将是持续研究的领域。
Photoshop产品管理总监Joel Baer表示:"期望,特别是来自专业用户的期望,是专业的商业结果。在许多情况下,根据你与Harmonize结合的资产,你可以得到这样的结果。在某些情况下,需要做更多的工作来完善输出。我们知道有一些用例需要继续优化和改进。"
目前,你需要使用测试版桌面应用程序或网络应用程序来使用这些新的AI工具。Harmonize功能还可以通过Photoshop iPhone移动应用程序使用。包含Photoshop的Adobe订阅计划起价为每月20美元。
Harmonize是Photoshop更长AI之路上的最新一步。即将为Photoshop用户带来的另外两个生成式 AI变化是新的生成式放大工具和生成式删除功能的升级。放大是一个常见的生成式 AI过程,用于改善现有图像,比如通过澄清和添加更精细的细节。在这种情况下,Photoshop工具承诺将图像分辨率提升到800万像素。更多的像素意味着你的图像应该更清晰。
新更新的删除工具在选择要擦除的对象时应该更精确,受影响的区域应该更无缝地融合,以获得更清洁的最终编辑效果。
Nielsen表示,在Photoshop中添加AI的目标是增强而不是取代人类编辑的工作。但许多创作者担心生成式 AI的开发和部署,从模型训练期间涉嫌的版权侵权到充斥在线空间的AI垃圾内容以及工作安全担忧。
Q&A
Q1:Harmonize功能是什么?它能做什么?
A:Harmonize是Adobe Photoshop最新的测试版AI功能,以图像协调处理过程命名。该工具能够帮助用户将图像无缝融合到项目中,通过AI技术创建新的光照环境,包括色彩和阴影的调整,使对象自然地融入背景。
Q2:使用Harmonize功能需要什么条件?
A:目前需要使用Photoshop的测试版桌面应用程序或网络应用程序才能使用这些新的AI工具。Harmonize功能还可以通过Photoshop iPhone移动应用程序使用。包含Photoshop的Adobe订阅计划起价为每月20美元。
Q3:Harmonize功能还有哪些需要改进的地方?
A:像任何测试版工具一样,Harmonize并不完美。未来的工作将专注于在处理更复杂对象(如人脸)时保持更高的质量水平。保持面部身份是最难解决的问题,这将是持续研究的领域。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。