Vidu推出参考图转图功能，用生成式AI重塑摄影创作

中国生数科技旗下AI产品Vidu发布新版本更新，推出"参考图像生成"功能，用户可上传最多7张参考图片，通过AI模型的语义理解技术将多张图像合成为高度一致的新图像。该功能支持快速编辑照片、替换物体、调整光照等操作，为摄影师、营销人员提供便捷的AI图像编辑工具，在保持视觉一致性方面与谷歌等竞品形成竞争。

中国升数科技旗下的人工智能产品Vidu今日发布平台新功能更新，旨在通过允许用户上传多张参考图像并由AI模型将其合成为生动、高度一致的生成图片来"重新定义摄影"。

Vidu以其生成式AI视频平台和基础模型而闻名，该公司允许用户输入自然语言并添加参考图像来制作短视频场景。该模型可以使用参考图像在场景中创建元素和对象，在不同场景间保持高度一致性。

Vidu表示已为图像生成实现了类似的参考图转图技术，该技术允许对生成内容中的参考资料进行更好的控制和一致性保持，用户最多可上传七张图像。

当用户使用此更新功能时，该公司的模型使用其称为"语义理解"的技术来解释多张图像之间的关系，从而产生更高的一致性。AI模型的这种能力此前存在一定错误率，直到最近，谷歌Gemini 2.5 Flash Image（也称为"Nano Banana"）等模型的突破才让人们更容易使用这项技术。

例如，用户可以使用Vidu的参考图转图功能，通过文本提示和多张独立图像从零开始生成新图像。据Vidu介绍，这允许以极高的一致性快速编辑照片。

比如，摄影师可以拍摄一张婚礼照片，然后添加花束等元素，改变桌上花朵的样式，或者在阴天或雨天时调整光线。用户可以使用该功能修改不太符合预期的自拍照，更换衬衫上的标志或将自己放置在不同的地方。营销人员和广告商将能够快速合成包含产品的AI生成"照片"，或在已完成的广告拍摄中更换产品模特。

Vidu表示已显著改善其即时图像编辑能力，与现有编辑平台竞争。寻求使用AI进行生成式图像合成的用户通常需要依赖编辑平台或高级工作流构建器（如开源工具ComfyUI）来实现一致性和控制。

该公司表示，使用这项新功能可实现的编辑功能包括重新混合、部分和完全对象替换以及添加对象。用户可以使用多张输入图像并将其自由合成为单张图像，该公司称与市场上其他模型相比具有"高度一致性"，包括视觉合理性。用户可以通过部分替换或对象替换来修改对象的外观，例如改变服装或雨伞的颜色，或完全用不同的对象替换。

Vidu的新模型功能与谷歌的Nano Banana和Black Forest Labs的Flux Context在生成式图像编辑和制作能力方面形成竞争。该公司表示，其模型通过提供所谓的"无与伦比的图像和角色一致性，以及自然的图像融合，带来更丰富、更逼真的细节"而脱颖而出，包括能够清晰地从参考图像中继承视觉效果和嵌入文本。现代生成式AI图像模型在准确渲染文本方面仍然困难重重，即使有参考图像也是如此。

Q&A

Q1：Vidu的参考图转图功能是什么？

A：参考图转图是Vidu推出的新功能，允许用户上传最多七张参考图像，通过AI模型的语义理解技术将多张图像合成为高度一致的生成图片，实现快速图像编辑和创作。

Q2：参考图转图功能可以用来做什么？

A：该功能可用于多种场景，包括修改婚礼照片的元素和光线、调整自拍照效果、更换服装标志、制作广告照片、替换产品模特等，支持重新混合、对象替换和添加对象等编辑操作。

Q3：Vidu与其他AI图像生成模型相比有什么优势？

A：Vidu声称其模型在图像和角色一致性方面具有优势，能够实现自然的图像融合，产生更丰富逼真的细节，并且能够清晰地从参考图像中继承视觉效果和嵌入文本，这是许多现代生成式AI模型仍在努力解决的问题。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Vidu推出参考图转图功能，用生成式AI重塑摄影创作

来源：SiliconANGLE

2025

09/09

07:58

分享

点赞

人工智能是否存在泡沫风险的深度分析

AI系统在压力下学会战略性欺骗的深层原因

数据中心备份电力系统对比分析

Paxos以超1亿美元收购加密钱包初创公司Fordefi

腾讯发布"读图神器"HunyuanOCR，只用1%的参数就打败了行业巨头？

联想天津工厂入选“世界智能制造十大科技进展” 以零碳智造打造业内标杆

联想万全异构智算研发团队入选IEEE CyberSciTech 2025，RNL技术成果获国际认可！

首款搭载千问的AI硬件：夸克AI眼镜新品发布 次日门店现排队潮

ServiceNow或以超10亿美元收购网络安全初创公司Veza

谷歌云推出"PanyaThAI"计划加速泰国AI应用

英国产学合作推进光纤射频通信技术商业化进程

阿里巴巴推出可换电池设计的Quark AI智能眼镜

SiFive推出面向AI设备的全新处理器核心设计

神经形态计算与边缘AI的未来发展

CIO未来职业发展的五个关键策略

IDC发布乐观AI支出预测：2029年将达1.3万亿美元

宏碁Aspire 14 AI：500美元实现专业级AI性能

博通获得100亿美元AI芯片新订单，股价创历史新高

哥伦比亚大学尝试用AI缓解学生矛盾冲突

AI让秋季公路旅行规划变得轻松简单

IT服务管理选购指南：21款顶级ITSM工具推荐

思科联手英伟达和VAST推出安全AI工厂解决方案

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

首款搭载千问的AI硬件：夸克AI眼镜新品发布次日门店现排队潮