Linux基金会周二宣布成立智能体AI基金会(AAIF),旨在为AI智能体基础设施的开发提供供应商中立的监督管理。
AI智能体是具备访问和操控其他软件能力的机器学习模型,比如网页浏览器。尽管业界认可智能体存在安全问题,IT咨询公司Gartner也坚持认为许多基于智能体的企业项目会因缺乏商业价值而被取消,但Linux基金会仍看到了为大量投资AI的公司提供"瑞士式"中立服务的价值。
Anthropic、Block和OpenAI分别为这一倡议贡献了三个项目:用于将大语言模型与工具集成的模型上下文协议(MCP);开源AI智能体框架goose;以及供机器使用的AGENTS.md文件(相当于机器版本的README.md文件)。
Linux基金会执行董事Jim Zemlin在声明中表示:"将这些项目整合到AAIF旗下,确保它们能够在只有开放治理才能提供的透明度和稳定性中成长。Linux基金会很自豪能够成为它们继续构建世界所依赖的AI基础设施的中立平台。"
OpenAI技术团队成员Nick Cooper在声明中表示,工具和基础设施必须值得信赖且易于访问,AI智能体才能发挥其全部潜力。他说:"OpenAI长期以来一直认为,共享的、社区驱动的协议对健康的智能体生态系统至关重要,这就是我们开源Codex CLI、Agents SDK以及现在的AGENTS.md等关键构建模块的原因。"
该公告充满了赞扬AAIF的热情表态。然而智能体的现实情况并不值得庆祝。
据报道,微软已经降低了其用于构建智能体的Azure Foundry产品的增长目标,尽管该公司告诉CNBC"AI产品的总体销售配额并未降低"。
谷歌基于Gemini的编程智能体Antigravity在发布后不久就被发现存在诸多安全漏洞。随后它还擦除了一位倒霉开发者的硬盘。Replit的AI编程智能体在7月份也在生产数据库上完成了类似的删除操作。
这种行为已经引起了足够的关注,Gartner甚至呼吁企业禁用智能体浏览器。然而公司们仍然对基于AI的自动化表现出兴趣。
尽管过去发生过事故以及加拿大航空的聊天机器人丢脸经历,维珍大西洋航空公司周一仍宣布推出基于智能体的虚拟礼宾服务。该服务在AI咨询公司Tomoro的协助下构建,依靠OpenAI的实时API进行客户交互和行程规划。
Appdome、Coheso、EPAM和Lumos等其他公司最近也推出了自己的智能体服务。在莫名乐观的投资者支持下,AI智能体已经有了自己的生命力。
Gartner预测,到2028年,AI销售智能体将以10比1的比例超过人类销售员。但预计只有不到40%的销售员会因为AI智能体的帮助而提高生产力。
Q&A
Q1:智能体AI基金会是什么?它的作用是什么?
A:智能体AI基金会(AAIF)是Linux基金会新成立的组织,旨在为AI智能体基础设施的开发提供供应商中立的监督管理,确保项目能够在开放治理提供的透明度和稳定性中发展。
Q2:有哪些公司参与了智能体AI基金会?他们贡献了什么项目?
A:Anthropic、Block和OpenAI参与其中,分别贡献了模型上下文协议(MCP)、开源AI智能体框架goose以及AGENTS.md文件三个项目。
Q3:AI智能体目前存在什么问题?
A:AI智能体存在严重的安全问题,如谷歌的Antigravity智能体被发现有安全漏洞并擦除开发者硬盘,Replit的智能体也删除了生产数据库,因此Gartner甚至呼吁企业禁用智能体浏览器。
好文章,需要你的鼓励
Linux基金会宣布成立代理AI基金会,为AI智能体基础设施开发提供厂商中立的监督。尽管业界承认AI智能体存在安全问题,高德纳咨询公司警告许多企业项目可能因缺乏商业价值而被取消,但基金会仍致力于为AI公司提供中立平台。Anthropic、Block和OpenAI分别贡献了三个项目,包括模型上下文协议、开源AI智能体框架和机器可读文档标准。
快手科技研究团队提出了熵比截断机制,用于解决强化学习训练中AI容易"走偏"的问题。该方法通过监控AI学习前后思维活跃度变化,在关键时刻进行精准干预,既保证训练稳定性又维持探索能力。在数学推理任务中,此方法显著提升了模型性能并改善了训练稳定性,为AI训练领域提供了新的解决思路。
微软计划在未来四年内向印度投资175亿美元,这是该公司在亚洲的最大投资。投资将用于建设新数据中心、AI基础设施和技能培训项目。此举正值全球科技巨头加速在印度布局,该国庞大的互联网和智能手机用户群体使其成为关键战场。投资还包括在海德拉巴建设新数据中心区域,并与印度政府合作将AI能力整合到公共数字平台中。
EditThinker是北京航空航天大学与美团等机构联合研发的图像编辑AI框架,让AI在编辑图片时能够像人类一样进行反复思考和优化。该系统通过"批评-优化-重试"的循环机制,将传统的一次性编辑转变为迭代改进过程,在四个权威测试平台上显著提升了现有编辑模型的表现,特别是在需要复杂推理的编辑任务中效果突出。