Siggraph 2025今年回到了不列颠哥伦比亚省温哥华,庆祝《玩具总动员》30周年和电子游戏实时渲染20周年。虽然Siggraph会花时间回顾过去,但它更多的是展望未来,多年来一直是图形行业发展方向的重要指标。Siggraph是一个以研究为导向的会议,世界上一些最聪明的人在这里分享他们在众多图形相关主题上的最新研究。例如,Adobe Research在Siggraph 2025上分享了超过25篇发表的论文,其中大部分都涉及AI技术。
英伟达的新GPU和物理AI模型
英伟达在Siggraph 2025上举办了为期三天的活动,包含数十场演讲,并有整天专门讨论渲染和OpenUSD框架。虽然OpenUSD多年来一直是英伟达的重点话题,但今年更强调新GPU以及它们如何为专业用户提供新的计算和AI能力。具体来说,英伟达宣布了配备Blackwell GPU的新RTX PRO服务器。今年早些时候在GTC 2025上宣布的RTX PRO 6000 GPU主要面向工作站应用。在Cadence Live上进一步扩展,Millennium M2000同时提供HGX B200和RTX PRO 6000 GPU。与上一代L40S GPU(Ada Lovelace)相比,这些新服务器在实时渲染FPS方面提升4倍,在大语言模型推理吞吐量方面提升6倍。英伟达表示,包括思科、戴尔科技、HPE、联想和Supermicro在内的合作伙伴将提供这些系统。
除了新的RTX PRO 6000服务器,英伟达还宣布了两款工作站GPU,以完善运行Blackwell的RTX PRO系列产品线。RTX PRO 4000 Blackwell SFF版本是一款双槽卡,配备24GB显存和770 AI TOPS,功耗仅70瓦。这意味着这些GPU不需要外部供电,因为PCIe插槽本身就提供75瓦功率。RTX PRO 4000售价1500美元,而RTX PRO 2000是一款545 TOPS GPU,配备16GB内存,同样70瓦TDP,售价700美元。这些是Ada代RTX 4000和RTX 2000 GPU的Blackwell替代产品。
英伟达还宣布了新的Omniverse库和Cosmos物理AI模型,以加速机器人技术的训练和实施,提供更精确的物理建模。英伟达的Isaac Sim将新的Omniverse NuRec库与高斯点云相结合,快速生成模拟真实世界的3D仿真。英伟达还与Google DeepMind合作,将USD集成到Mujoco的文件格式中,无缝地将USD集成到Omniverse中。新的Cosmos模型延续了世界生成主题。Cosmos Transfer1能够创建可控制的照片级真实合成数据,从多个视频源中提取信息创建用于训练的合成3D环境。而Cosmos Predict2是一个从图像到未来世界状态的模型,旨在预测仿真中的运动和动作。英伟达还宣布了Cosmos Reason 7B,这是其用于多种设备端AI应用的最先进推理视觉语言模型。这些应用包括物理AI数据管理和注释、机器人推理以及AI智能体的视频分析。
Meta的新原型头显
Meta的Reality Labs研究部门总是在Siggraph上展示有趣的内容。今年也不例外,Tiramisu和Boba 3头显旨在展示Meta研究的方向。Tiramisu的目标是创造超逼真的VR体验,分辨率比Quest 3高三倍多,亮度高14倍。
虽然这款头显距离商业化还很远,但它展示了技术上的可能性以及VR在图像质量和亮度方面的未来发展方向。Meta使用虚幻引擎5演示了这款头显,并借助英伟达DLSS 3的帮助,抵消了在如此高分辨率下渲染的一些计算成本。需要注意的是,Meta表示这款头显的当前版本视野范围非常有限,仅为33×33度,比目前大多数头显的视野要窄得多。
另一方面,Boba 3将视野范围推向了完全不同的极端,提供200度视野。这比大多数消费级头显提供的110度视野要宽得多。200度对角视野是通过结合180度水平视野和120度垂直视野来测量的,Meta将其与Quest 3的110度和96度进行了比较。Meta声称Boba 3的视野覆盖了人眼视野的大约90%,其中大部分不是全分辨率的。Boba 3还有一个VR原型版本,重量(660克)比Boba 3(840克)甚至Quest 3(698克)都要轻得多。在Siggraph 2025期间,两款Boba 3头显和Tiramisu都在Meta的展台进行了演示。
Arm专注2026年神经渲染技术
Arm今年一直在积极提升其GPU的图形能力。该公司今年早些时候宣布了Arm ASR以改善包括游戏在内的图形图像质量,现在以神经超采样功能的形式将神经技术添加到产品组合中。这一功能在桌面领域已经很常见,英伟达和AMD都经历了多代自己的神经超采样器,但对于移动设备来说相对较新,能够大大降低GPU工作负载。Arm声称通过以较低分辨率渲染然后超采样到原生分辨率,GPU工作负载可减少多达50%。这与竞争对手在AI加速超采样实现方面的声明一致。
Arm还宣布了自己的帧生成技术,称为神经帧率提升,这是行业中较新的能力,在保持高帧率的同时提供节能机会。这些神经能力计划在硬件级别内置到Arm 2026年的下一代GPU中,并将配备用于Vulkan图形API的ML扩展。Arm还将为不使用Vulkan的用户提供神经图形开发套件。
Khronos将glTF扩展到地理空间高斯点云
Khronos集团是图形世界中最重要的标准机构之一。与许多其他标准机构一样,它对大多数人来说是完全透明的,但其工作对行业的未来发展绝对至关重要。Khronos联盟开发了一种名为glTF的移动和高效3D格式——代表图形库传输格式——能够以最小的开销实现跨平台3D体验和资产。Khronos集团在Siggraph 2025上宣布,将与开放地理空间联盟、Niantic Spatial、Cesium和Esri合作,将地理空间高斯点云集成到glTF 3D资产格式标准中。高斯点云已成为一种流行的AI加速技术,用于以最小成本生成人物、地点和物体的3D模型。
这种合作应该扩大glTF的应用范围,使更多行业能够利用这种已经流行的格式,同时借助高斯点云实现更快、更简单的3D资产创建方式。我相信3D地理空间行业将从其成员为Web和移动设备构建的深度glTF基础设施中受益匪浅,随着该格式的进一步应用将受益更多。
XR与AI携手并进
Siggraph 2025再次证实了XR和AI之间存在无数交集,无论我们谈论的是被集成到glTF中的地理空间高斯点云,还是严重依赖AI来实现高分辨率渲染的新XR头显。英伟达显然表明,它将3D渲染与AI相结合作为其业务的基本构建块——其GPU是该愿景的核心。甚至Arm也表明,其下一代GPU将专注于神经图形技术,我们正处于神经图形时代——无论是在云端、PC还是移动设备上。基于Siggraph 2025展示的研究和新发展,我预计在未来几个月和几年中会看到更多XR和AI的新颖组合。
Q&A
Q1:英伟达RTX PRO 4000 Blackwell SFF版本有什么特点?
A:RTX PRO 4000 Blackwell SFF版本是一款双槽卡,配备24GB显存和770 AI TOPS,功耗仅70瓦。由于PCIe插槽本身提供75瓦功率,这些GPU不需要外部供电,售价1500美元。
Q2:Meta展示的Tiramisu和Boba 3头显有何区别?
A:Tiramisu专注于超高分辨率和亮度,分辨率比Quest 3高三倍多,亮度高14倍,但视野仅33×33度。Boba 3则专注于极宽视野,提供200度视野范围,覆盖人眼视野的约90%。
Q3:Arm的神经超采样技术能带来什么好处?
A:Arm的神经超采样功能通过以较低分辨率渲染然后超采样到原生分辨率,能够减少多达50%的GPU工作负载,同时还有神经帧率提升技术在保持高帧率的同时节能。
好文章,需要你的鼓励
美国劳动节前夕,AI与就业话题从猜测转向政策核心。美联储主席鲍威尔在杰克逊霍尔会议上表示,疲软的就业市场与顽固通胀并列成为美联储风险考量因素。市场解读为降息信号并大涨。研究显示AI主要推动就业重新配置而非大规模失业,仅4%岗位高度依赖AI。采用AI的企业内部流动性增加一倍,但员工job安全感并未下降。美联储将密切关注AI生产力提升如何影响工资谈判和就业稳定。
Hugging Face团队发布SmolLM2语言模型研究报告,详细阐述了17亿参数小型模型的创新训练方法。该研究通过多阶段精细化训练策略和三个全新数据集(FineMath、Stack-Edu、SmolTalk)的创建,证明了小模型在数据质量优化下可达到优异性能。模型在多项基准测试中超越同规模竞品,为人工智能技术的普及化和可持续发展提供了新的技术路径。
传统的数字堡垒安全模式已经过时,在云服务和远程办公时代,身份成为网络安全的新前线。Ping Identity首席执行官Andre Durand讨论了从简单密码到复杂验证的演进,去中心化数字凭证如何减少数据泄露影响,以及身份与人工智能的关系。他强调现代安全的核心是"只信任已验证的",AI代理需要具备身份认证和授权机制,所有数字交易都必须基于可验证的身份建立信任。
ByteDance研究团队发布OmniHuman-1,这是一个革命性的AI人物动画生成系统。该技术只需一张照片和音频就能生成逼真的说话视频,支持真人、动漫角色等多种图像类型。核心创新在于"全方位条件训练"策略,通过同时使用文字、音频、动作三种条件,将可用训练数据从10%提升到100%,显著改善了生成质量和多样性,为AI视频制作技术带来重大突破。