在生成式 AI时代,Adobe为Photoshop核心的图像合成功能带来了革命性升级。Harmonize作为Photoshop最新的测试版功能,以图像协调处理过程命名,该工具能够帮助用户将图像无缝融合到项目中,通过自然混合的方式将对象融入背景。
该工具使用AI技术创建新的光照环境,包括色彩和阴影的调整。只需点击一下Harmonize按钮,Photoshop就会创建一个不可见的图层并将其应用到图像上,使其与项目的其他部分几乎完美融合,而不会破坏任何一张原始图像。前后对比效果显著,旨在将原本繁琐、需要注重细节的编辑过程缩短到几分钟内。
在去年秋季Adobe Max创作者大会上,Photoshop用户首次看到了这一仍处于研究概念阶段的工具。Adobe应用研究科学家Mengwei Ren作为该项目的主要工程师之一,分享了这个工具对Photoshop用户的巨大潜力。在观众的"非常震惊"的积极反应后,她和Photoshop团队致力于完善该工具。现在发布的测试版工具是多年机器学习和图像工作的成果。
Ren表示:"我们尝试用不同的方法来解决这个问题。我们最初只是尝试对人脸进行重新照明,然后我们还尝试了一个单独的模型来只添加阴影。在某个时候,因为生成式 AI技术真正在发展,我们开始大胆思考,'好吧,我们真的能把这些整合到一个统一的模型中吗?'"
自Max大会以来,团队已经增强了该工具的分辨率以获得更高质量的输出,创建了更精确的控件来为用户提供像素级对齐,并扩展了训练数据集以帮助工具为任何图像创建准确的光照条件。根据Adobe的AI用户指导原则和条款,该公司不会使用客户内容进行训练,其模型是基于授权内容训练的,包括Adobe Stock和公共领域内容。
Photoshop产品管理高级总监Stephen Nielsen表示,更快、更流畅的合成是Adobe团队近十年来一直在努力的方向。AI时代之前改进选择和背景移除工具的工作为Harmonize奠定了基础。生成式 AI技术帮助将拼图的所有不同部分组合在一起,使人们能够快速使用。
Nielsen说:"人们经常谈论某些东西被'粗糙地Photoshop处理',其中很大一部分与你如何很好地匹配光照、色调和阴影有关。这使得实现真正好的合成变得更快、更高效、更容易。"
像任何测试版工具一样,特别是涉及AI的工具,Harmonize并不完美。未来的工作将专注于在处理更复杂对象(如人脸)时保持更高的质量水平。保持面部身份是"最难解决的事情",Nielsen说,这将是持续研究的领域。
Photoshop产品管理总监Joel Baer表示:"期望,特别是来自专业用户的期望,是专业的商业结果。在许多情况下,根据你与Harmonize结合的资产,你可以得到这样的结果。在某些情况下,需要做更多的工作来完善输出。我们知道有一些用例需要继续优化和改进。"
目前,你需要使用测试版桌面应用程序或网络应用程序来使用这些新的AI工具。Harmonize功能还可以通过Photoshop iPhone移动应用程序使用。包含Photoshop的Adobe订阅计划起价为每月20美元。
Harmonize是Photoshop更长AI之路上的最新一步。即将为Photoshop用户带来的另外两个生成式 AI变化是新的生成式放大工具和生成式删除功能的升级。放大是一个常见的生成式 AI过程,用于改善现有图像,比如通过澄清和添加更精细的细节。在这种情况下,Photoshop工具承诺将图像分辨率提升到800万像素。更多的像素意味着你的图像应该更清晰。
新更新的删除工具在选择要擦除的对象时应该更精确,受影响的区域应该更无缝地融合,以获得更清洁的最终编辑效果。
Nielsen表示,在Photoshop中添加AI的目标是增强而不是取代人类编辑的工作。但许多创作者担心生成式 AI的开发和部署,从模型训练期间涉嫌的版权侵权到充斥在线空间的AI垃圾内容以及工作安全担忧。
Q&A
Q1:Harmonize功能是什么?它能做什么?
A:Harmonize是Adobe Photoshop最新的测试版AI功能,以图像协调处理过程命名。该工具能够帮助用户将图像无缝融合到项目中,通过AI技术创建新的光照环境,包括色彩和阴影的调整,使对象自然地融入背景。
Q2:使用Harmonize功能需要什么条件?
A:目前需要使用Photoshop的测试版桌面应用程序或网络应用程序才能使用这些新的AI工具。Harmonize功能还可以通过Photoshop iPhone移动应用程序使用。包含Photoshop的Adobe订阅计划起价为每月20美元。
Q3:Harmonize功能还有哪些需要改进的地方?
A:像任何测试版工具一样,Harmonize并不完美。未来的工作将专注于在处理更复杂对象(如人脸)时保持更高的质量水平。保持面部身份是最难解决的问题,这将是持续研究的领域。
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。