AMD Silo AI与博洛尼亚大学计算机科学与工程系(DISI)正式启动研究合作,旨在将显式三维几何信息融入面向机器人与自动驾驶的视觉-语言-动作(VLA)模型及世界模型流水线,并原生运行于AMD ROCm(TM)平台之上。此次合作将DISI旗下专注于立体视觉与深度估计的领先研究团队CVLab,确立为双节点学术枢纽中的空间AI节点,与摩德纳雷焦艾米利亚大学(UniMoRE)并驾齐驱。该枢纽将持续为AMD Silo AI开放式物理AI研究项目"世界模型铸造厂"(World Models Foundry)提供支持,并与欧盟科学AI工厂等欧洲战略计划保持高度协同。
AMD软件开发高级总监Niko Vuokko表示:"机器人与自动驾驶的下一次浪潮,依赖的是不仅仅能够分类或生成的AI系统。这些系统必须建立对三维世界的扎实理解,在时间和视角变化下保持一致性,并在计算平台上高效运行。这正是本次合作的核心所在。"他补充道:"我们将与DISI及其他生态合作方共同构建VLA与世界模型流水线目前所欠缺的空间AI层,目标是将几何理解领域的前沿研究转化为开放、高性能的ROCm原生软件,推动整个物理AI生态向前迈进。"
DISI CVLab在立体视觉、深度估计与三维重建领域拥有深厚积累,研究成果多次发表于CVPR、ICCV、ECCV等顶级学术会议。AMD Silo AI与CVLab将联合设计感知与表示模块,将显式三维几何与深度信息融入端到端VLA架构和世界模型架构,研究工作将重点面向AMD Instinct(TM) MI系列GPU及未来的ROCm平台。
本次研究围绕三大核心方向展开:
几何感知骨干网络:涵盖立体视觉、深度估计、多视角感知、鸟瞰图(BEV)及三维场景表示。
基于ROCm的高效几何感知训练与推理:包括BEV与点云处理流水线,以及集成于端到端VLA架构的几何模块。
面向机器人与自动驾驶的评估体系:结合仿真与真实数据,重点关注空间推理能力、三维一致性,以及对视角变化与遮挡的鲁棒性。
博洛尼亚大学(DISI)副教授Matteo Poggi表示:"多年来,我们的研究始终聚焦于帮助机器从图像中恢复深度、形状与结构。此次合作让我们有机会将这一研究方向融入更大规模的VLA与世界模型体系,应用于机器人与自动驾驶领域。借助AMD的平台,我们可以将几何感知视觉研究转化为ROCm原生的基础模块,在相关平台上进行验证,并以开放形式发布,供更广泛的社区使用与迭代。"
本次研究还具有直接的产业价值——意大利领先机器人企业Generative Bionics深度参与其中。该公司专注于为真实应用场景设计和部署全栈式人形机器人系统,与DISI、UniMoRE及AMD保持紧密的工程协作,将部署经验带入研究体系,助力科研成果落地为实际可用的机器人平台。
关于博洛尼亚大学与CVLab
博洛尼亚大学创建于1088年,是欧洲历史最悠久、声誉最卓著的研究型大学之一。CVLab是其计算机科学与工程系下属研究团队,在立体视觉、深度估计、三维重建及几何感知方面具有深厚专长,研究成果广泛发表于CVPR、ICCV、ECCV、ICRA等顶级学术会议,并积极贡献于三维视觉领域的开源基准测试与工具生态。
Q&A
Q1:AMD Silo AI与博洛尼亚大学的空间AI合作具体研究什么内容?
A:此次合作聚焦于将显式三维几何信息融入VLA模型和世界模型流水线,主要涵盖三个方向:几何感知骨干网络(含立体视觉、深度估计、BEV等)、基于ROCm的高效几何感知训练与推理、以及面向机器人与自动驾驶的评估体系。研究成果将原生运行于AMD ROCm平台,并面向开源社区开放发布。
Q2:CVLab在这次合作中扮演什么角色?
A:CVLab是博洛尼亚大学DISI下属的计算机视觉研究团队,在立体视觉、深度估计和三维重建领域拥有深厚积累,研究成果多次发表于CVPR、ICCV、ECCV等顶会。在此次合作中,CVLab被确立为双节点学术枢纽中的空间AI节点,与AMD Silo AI联合设计感知与表示模块,将几何理解研究转化为ROCm原生的开放软件工具。
Q3:Generative Bionics在此次合作中起到什么作用?
A:Generative Bionics是一家意大利领先机器人企业,专注于全栈式人形机器人系统的设计与部署。在此次合作中,该公司与DISI、UniMoRE及AMD保持紧密工程协作,将真实场景的部署经验引入研究体系,帮助将前沿空间AI研究成果转化为实际可用的机器人平台,为研究赋予直接的产业价值。
好文章,需要你的鼓励
Google Health 5.0作为Fitbit应用的更新版本正式推出。在安卓端,新版本引入了主屏幕快捷访问小组件,取代原有的圆形步数小组件,可显示最多六项健康指标,支持自定义缩放。点击小组件可跳转至完整统计页面,左上角心形图标可快速打开应用,右侧可直达Health Coach功能。此次更新还启用了全新Google Health图标,移除Fitbit品牌标识。安卓版已于5月19日开始推送,5月26日前全面覆盖。
中科院团队发现顶级AI在几何作图上成功率不到6%,推出PAGER系统将精度提升4.1倍,揭示AI能力评估的关键盲点。
奥迪宣布将推出入门级纯电动车型A2 e-tron,旨在降低豪华电动车的拥有门槛。该车型基于大众最新MEB平台打造,预计提供50kWh、58kWh和79kWh三种电池选项,续航最高可达630公里。目前原型车正在瑞典北部极寒环境及巴伐利亚道路进行测试,重点验证热管理与电池性能。新车预计售价约4万美元,将于今年秋季正式亮相。
浙江大学等机构提出Flash-GRPO视频AI训练新方法,通过同时段分组和梯度校正两项创新技术,实现训练速度提升6倍且质量更优。