不久前,我意识到有一个全新的标准正在重构网络,而目前几乎没有人讨论它。
我们先从名字开始: Networked Agents and Decentralized AI 或 NANDA,是一个用于 AI 代理的网络协议,目前主要由 MIT 推进研究。
需要注意的是,从设计背景来看,NANDA 建立在 Anthropic 的 Model Context Protocol (MCP) 基础之上,该协议为 AI 代理提供了标准化交互的机制。而 NANDA 则通过增加互联网功能和协议,使这些代理能够在网络上“开展工作”。
概括来说就是如此,但要实现这一目标仍需大量努力。我觉得真正有趣的是,很少有人知道这一进展正在进行中。
Googling and ChatGPT
我之前从未听说过 NANDA,于是进行了简单的网络搜索。结果主要出现与护理行业相关的信息,同时还有一个面向印地语的大语言模型项目使用了相同的名称。
不过,一些撰写关于 NANDA 论文的作者在 LinkedIn 上发布了有关这一协议运作方式的说明。
“正如 DNS 通过提供中立的网络访问框架而引发互联网革命,我们同样需要为‘代理互联网’构建类似的基础架构,” MIT 博士候选人 Ayush Chopra 在阐述这一理念时写道,“我们正在与国家实验室和全球大学(分布于 8 个时区)合作推出 NANDA —— 一个针对 AI 代理的注册、验证与声誉的开放协议。NANDA 将为不同系统间的无缝协作铺平道路,并与诸如 MCP 和 A2A 等企业级协议保持完全兼容。这个举措是向代理式 AI 民主化迈进的一步,旨在构建一个让专门代理协同解决复杂问题的生态系统,就像 DNS 为网络所做的一样。”
至于 ChatGPT,当我问这个模型“ NANDA 是为网络做什么的?”时,它返回的是关于护理组织的信息。
我不得不特意说明项目全称 Networked Agents and Decentralized AI,但它确实将这一项目归因于 MIT Media Lab,尤其是与我的朋友兼同事 Ramesh Raskar 有关。它迅速给出了如下双重回应,我觉得非常准确:
? 是的,确实存在一个名为 NANDA —— Networked Agents and Decentralized AI 的新领域或研究项目。 ? 它与护理领域的 NANDA 完全不同。
这无疑是个良好的开端(而且 ChatGPT 还提供了更多信息)——不过我们可以从实际参与者那里获得更深入的了解。
Ramesh Raskar 解析 NANDA
现在让我们来看看 Raskar 在四月初举行的 Imagination in Action 活动中的发言。
在演讲中,他解释说,NANDA 实际上是一种互联网协议,是为 AI 构建的“TCP/IP”(我觉得这种比喻非常贴切,因此把它作为本文标题)。
他提到,互联网是为计算机而设,而万维网则是为人们服务。NANDA 则旨在让 AI 代理能像人类一样使用互联网。
举例来说,Raskar 提出了为孩子策划生日派对的情景,届时可以设想利用 AI 代理自动购买蛋糕、气球及其他所需物品,从而实现流程全自动化。
关于推广,他表示 NANDA 已在 15 所重点大学的 DNS 中进行了注册。他还提到部署的三步流程: 1. 主机注册, 2. 构建 API, 3. 连接到开源平台。
随后,Raskar 在接受 Aaron Pressman 提问时谈到了这一体系未来的推广方式。
“每个人都在渴望某种开放而充满活力的系统,”他说道,“MIT 有着悠久的历史。我们深受 Tim Berners Lee 以及 MIT 万维网联盟的启发,他们在 90 年代初至 90 年代中期展示了如何构建开放、充满活力的网络,并释放出巨大的经济价值。”
Raskar 呼吁开展“宏大、开放且包容”的项目,并提出我们正处于一个“智慧经济”时代,而非传统的交易或知识经济。
“可以想象,当每个人都有能力创建自己的 AI 代理时,无论是每个商店、个体还是组织都能训练和部署自己的代理,就会带动数十亿乃至数万亿美元的价值创造,”他表示,并宣传 NANDA 作为构建推动新一代网络商业基础设施的平台。
NANDA 的缩写
我觉得这一点很有趣:在演讲中,Raskar 与 Chopra 都向我们介绍了一个新术语: A2A —— Agent to Agent(代理对代理)。
在讨论加密技术和智能合约的应用时,Raskar 还提出了“Know Your Agent” (KYA) 的概念,这大概对应于加密领域中使用的“Know Your Customer” (KYC) 协议。
“如果你考虑整个互联网协议栈,我们将 Yelp 等服务保留在应用层,因为它们涉及评分的复杂人性化因素。但由于这是代理间的通信,很多交互都是算法处理的,”他说道。
NANDA 的未来
Raskar 的演讲帮助我们理解了 NANDA 的背景、用途以及它可能的发展方向。令我感到兴奋的部分原因在于,这一成果目前仍未为大众所广泛知晓。
最初,我们拥有 Web 1.0 —— 只读型网络,用户主要浏览以 HTML 编写的文本与图像。
Web 2.0 则是读写型网络,用户可以通过填写表单将信息传送给网站管理员或主机。
Web 3.0 是具备读写和功能性的网络,用户既可以双向交换信息,也能调用内置的网络功能。
Web 4.0 则是由机器为我们完成所有这些任务,我们只需坐享成果。
至少,这就是构想。
期待这一成果能不断推进,并迅速进入公众视野。
好文章,需要你的鼓励
西部数据首席产品与工程官Ahmed Shihab表示,公司HAMR技术进展顺利,OptiNAND能提供容量优势。HAMR技术物理原理已突破,正进行制造工艺优化。相比希捷10盘片技术,西数11盘片设计提供更大发展空间,可更快推向市场。OptiNAND结合UltraSMR算法可实现更高单盘容量。公司采取保守策略,注重可靠性,客户已完成相关软件认证。硬盘在数据经济中仍是基础,在视频监控等写密集型应用中具备成本和耐久性优势。
新加坡国立大学研究团队开发了SPIRAL框架,通过让AI与自己对弈零和游戏来提升推理能力。实验显示,仅训练AI玩简单扑克游戏就能让其数学推理能力提升8.6%,通用推理提升8.4%,且无需任何数学题目作为训练材料。研究发现游戏中的三种推理模式能成功转移到数学解题中,为AI训练提供了新思路。
一旦人工智能达到通用智能(AGI)或超级智能(ASI)水平,人类将无法逆转回传统AI。AGI与人类智力相当,ASI则超越人类智慧。由于人类会对此类AI产生依赖,且AGI/ASI具备自我保护能力,通过全球禁令、内置终止开关或控制措施都难以有效阻止。AI末日论者担心existential风险,而AI加速主义者认为将解决人类问题。唯一可能的逆转机会是AGI/ASI主动选择关闭自己以拯救人类。
同济大学团队开发的GIGA-ToF技术通过融合多帧图像的"图结构"信息,创新性地解决了3D相机噪声问题。该技术利用图像间的不变几何关系,结合深度学习和数学优化方法,在合成数据集上实现37.9%的精度提升,并在真实设备上展现出色泛化能力,为机器人、AR和自动驾驶等领域提供更可靠的3D视觉解决方案。