谷歌DeepMind推出全新AI智能体SIMA 2,该系统能够学会玩多款视频游戏,包括《无人深空》、《英灵神殿》和《山羊模拟器3》等,成为可行的"交互式游戏伙伴"。
SIMA 2基于早期版本构建
这款新智能体工具SIMA 2基于其早期版本SIMA(可扩展指令多世界智能体)构建,后者于2024年3月发布。SIMA 2首次整合了谷歌的Gemini AI技术,使智能体能够超越简单的指令执行,实现"理解用户的高级目标,进行复杂推理,并在游戏中熟练执行目标导向的行动",即使面对从未见过的游戏也能应对自如。目前该系统正以有限研究预览版的形式向部分学者和开发者开放。
DeepMind团队表示,尽管SIMA 2在游戏方面表现出色,但创建面向消费者的游戏助手并非其主要目标。DeepMind高级研究科学家Jane Wang将其称为"一个绝佳的训练场",有望将这些技能转移到现实世界环境中。
AGI竞赛的重要里程碑
正如往常一样,这一切都回到了谷歌、Meta、OpenAI、Anthropic等公司之间日益激烈的AGI竞赛。DeepMind在博客文章中表示:"这是朝着通用人工智能(AGI)方向迈出的重要一步,对未来机器人技术和AI实体化具有重要意义。"
DeepMind研究科学家Joe Marino进一步强调,SIMA 2在虚拟世界中采取行动并处理从未见过环境的能力,是迈向AGI的"基础"步骤,并可能为未来构建通用机器人奠定基础。
该智能体通过游戏世界的复杂环境进行学习和适应,展现了AI系统在动态环境中的学习能力和泛化能力。这种技术突破不仅推进了游戏AI的发展,更为实现真正的通用人工智能提供了重要的技术路径。
Q&A
Q1:SIMA 2是什么?它有什么特别之处?
A:SIMA 2是谷歌DeepMind开发的AI智能体,能够学会玩多款视频游戏。它首次整合了Gemini AI技术,能够理解用户高级目标,进行复杂推理,并在从未见过的游戏中熟练执行任务。
Q2:SIMA 2与通用人工智能有什么关系?
A:DeepMind认为SIMA 2是迈向AGI的重要步骤。它在虚拟世界中采取行动和处理未知环境的能力,为构建通用机器人和实现真正的通用人工智能提供了基础技术路径。
Q3:普通用户能使用SIMA 2吗?
A:目前SIMA 2仅以有限研究预览版形式向部分学者和开发者开放,尚未面向普通消费者发布。DeepMind表示创建消费级游戏助手并非主要目标。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。