Microsoft 的 Magma AI 可以操控和控制机器人

微软推出了新型AI模型Magma，旨在提升机器人的视觉、理解和行动能力。Magma能同时处理多种类型的数据，是朝着"代理AI"迈出的重要一步。该模型结合了视觉和语言处理技术，经过多模态训练，可以执行操控机器人和导航用户界面等任务，为AI自动化日常生活开辟了新的可能性。

Microsoft 刚刚推出了 Magma，这是一款新型人工智能模型，旨在帮助机器人更智能地观察、理解和行动。与传统的 AI 模型不同，Magma 可以同时处理不同类型的数据——Microsoft 称这是朝着"主动式 AI"（即能够代表用户规划和执行任务的系统）迈出的重要一步。

这个结合了视觉和语言处理的模型，通过视频、图像、机器人数据和界面交互进行训练，使其比以往的模型更加多功能。

在其 Github 页面上，Microsoft 研究团队概述了 Magma 如何执行任务，比如操控机器人和导航用户界面（如点击按钮）等功能。

为了开发这项技术，该公司与马里兰大学、威斯康星大学麦迪逊分校和华盛顿大学的研究人员展开合作。

在各大科技巨头竞相开发能够自动化日常生活更多方面的 AI 代理之际，这项技术应运而生。Google 一直在推进面向机器人的语言模型，而 OpenAI 的 Operator 工具则旨在通过在专用浏览器中进行打字、点击和滚动来处理预订、订购杂货和填写表格等日常任务。

该项目的首席研究员杨建伟 (Jianwei Yang) 告诉 CNET，AI 的未来不仅仅是为聊天机器人开发多模态基础模型。

他表示："我们认为 AI 的下一个重要步骤在于开发能够无缝理解和交互数字和物理环境的代理。"

他说，Magma 的重要性在于其弥合多模态 AI 代理差距的能力，因为传统 AI 模型在语言智能方面表现出色，但在规划和现实世界行动方面往往力不从心。

他解释道："如今的机器人往往依赖于特定领域数据的特定任务训练，导致它们处理简单日常任务的能力有限，更不用说适应新任务和环境了。Magma 通过显著提升它们的语言和空间智能改变了这一点，使机器人能够基于数字或物理环境准确有效地执行动作。"

同时，Forrester 首席分析师兼《Random Acts of Automation》作者 Craig Le Clair 表示，这一消息与该市场研究公司预测的"2025 年 25% 的机器人项目将结合认知和物理自动化"相符。不过，他说，关于这个公告和其他类似公告是否代表真正的转折点，还是仅仅是大语言模型的又一次尝试，争论仍在继续。

Le Clair 说："Microsoft 提供了重要的开发者能力，但现在需要在指导富有成效且安全的人机交互方面展现领导力。"

来源：cnet

0赞

好文章，需要你的鼓励

Microsoft 的 Magma AI 可以操控和控制机器人

来源：cnet

2025

02/24

16:28

分享

点赞

百度学术：行业首个一站式AI学术平台，6.9亿文献资源加持

腾讯开源混元MT翻译模型系列

Unity Stoakes谈科技、科学与设计的融合变革全球健康

微软结束OpenAI独家合作，Office将引入Anthropic模型

亚马逊推出Zoox无人出租车服务，在拉斯维加斯提供免费乘车体验

OpenAI与Oracle签署3000亿美元云计算合作协议

Akamai联合IDC研究：生成式AI驱动边缘演进，亚太80% CIO将依赖边缘服务支持AI工作负载

Gartner发布2025中国网络安全技术成熟度曲线

Lucidity将成本控制焦点转向Kubernetes存储

Spotify因万名用户出售数据构建AI工具而愤怒

Anthropic服务大规模宕机，开发者调侃重回"原始编程时代"

AI说谎的原因：它只是在迎合你想听的答案

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: