Microsoft 的 Magma AI 可以操控和控制机器人

微软推出了新型AI模型Magma，旨在提升机器人的视觉、理解和行动能力。Magma能同时处理多种类型的数据，是朝着"代理AI"迈出的重要一步。该模型结合了视觉和语言处理技术，经过多模态训练，可以执行操控机器人和导航用户界面等任务，为AI自动化日常生活开辟了新的可能性。

Microsoft 刚刚推出了 Magma，这是一款新型人工智能模型，旨在帮助机器人更智能地观察、理解和行动。与传统的 AI 模型不同，Magma 可以同时处理不同类型的数据——Microsoft 称这是朝着"主动式 AI"（即能够代表用户规划和执行任务的系统）迈出的重要一步。

这个结合了视觉和语言处理的模型，通过视频、图像、机器人数据和界面交互进行训练，使其比以往的模型更加多功能。

在其 Github 页面上，Microsoft 研究团队概述了 Magma 如何执行任务，比如操控机器人和导航用户界面（如点击按钮）等功能。

为了开发这项技术，该公司与马里兰大学、威斯康星大学麦迪逊分校和华盛顿大学的研究人员展开合作。

在各大科技巨头竞相开发能够自动化日常生活更多方面的 AI 代理之际，这项技术应运而生。Google 一直在推进面向机器人的语言模型，而 OpenAI 的 Operator 工具则旨在通过在专用浏览器中进行打字、点击和滚动来处理预订、订购杂货和填写表格等日常任务。

该项目的首席研究员杨建伟 (Jianwei Yang) 告诉 CNET，AI 的未来不仅仅是为聊天机器人开发多模态基础模型。

他表示："我们认为 AI 的下一个重要步骤在于开发能够无缝理解和交互数字和物理环境的代理。"

他说，Magma 的重要性在于其弥合多模态 AI 代理差距的能力，因为传统 AI 模型在语言智能方面表现出色，但在规划和现实世界行动方面往往力不从心。

他解释道："如今的机器人往往依赖于特定领域数据的特定任务训练，导致它们处理简单日常任务的能力有限，更不用说适应新任务和环境了。Magma 通过显著提升它们的语言和空间智能改变了这一点，使机器人能够基于数字或物理环境准确有效地执行动作。"

同时，Forrester 首席分析师兼《Random Acts of Automation》作者 Craig Le Clair 表示，这一消息与该市场研究公司预测的"2025 年 25% 的机器人项目将结合认知和物理自动化"相符。不过，他说，关于这个公告和其他类似公告是否代表真正的转折点，还是仅仅是大语言模型的又一次尝试，争论仍在继续。

Le Clair 说："Microsoft 提供了重要的开发者能力，但现在需要在指导富有成效且安全的人机交互方面展现领导力。"

来源：cnet

0赞

好文章，需要你的鼓励

Microsoft 的 Magma AI 可以操控和控制机器人

来源：cnet

2025

02/24

16:28

分享

点赞

智能体驱动全球创新浪潮，微软携手前沿伙伴迈进消费电子新未来

达索系统在CES 2026上展示AI驱动的医疗创新， 重塑精准、可预测与个性化医疗

Arm 发布 20 项技术预测：洞见 2026 年及未来发

美光推出全球首款面向客户端计算的 PCIe 5.0 QLC SSD

SanDisk重塑经典SSD品牌：WD Black和Blue正式更名为Optimus系列

福特汽车准备在车载系统中引入AI智能助手

ChatGPT推出健康模式：结合医疗数据提供个性化建议

福特推出AI数字助理及新一代BlueCruise自动驾驶技术

联想Legion Pro可卷曲概念机展现移动大屏游戏新体验

印度和新加坡在智能体AI采用方面超越全球同行

华硕CES 2026新品：更小巧的ProArt GoPro笔记本和升级版Zenbook Duo

n8n警告CVSS满分漏洞影响自托管和云版本

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

达索系统在CES 2026上展示AI驱动的医疗创新，重塑精准、可预测与个性化医疗