AI 公司创始人们经常对这项技术改变各个领域(尤其是科学领域)的潜力做出大胆断言。但 Hugging Face 的联合创始人兼首席科学官 Thomas Wolf 却持有一个更为谨慎的观点。
在周四发布在 X 平台上的一篇文章中,Wolf 表示,他担心在没有 AI 研究突破的情况下,AI 正在成为"服务器上的应声虫"。他进一步解释说,目前的 AI 发展模式无法产生具备跳出框架、创造性解决问题能力的 AI —— 这种解决问题的能力才是获得诺贝尔奖的关键。
Wolf 写道:"人们通常犯的最大错误是认为像牛顿或爱因斯坦这样的人只是优秀学生的放大版,认为天才就是把前 10% 的学生线性外推的结果。要在数据中心创造一个爱因斯坦,我们需要的不仅是一个知道所有答案的系统,而是一个能够提出别人从未想到或不敢问的问题的系统。"
Wolf 的观点与 OpenAI CEO Sam Altman 形成鲜明对比,后者在今年早些时候的一篇文章中表示,"超级智能" AI 可以"大幅加速科学发现"。同样,Anthropic CEO Dario Amodei 也预测 AI 可以帮助找到大多数癌症类型的治疗方法。
Wolf 认为当今 AI 的问题 —— 以及他认为这项技术正在走向何方 —— 在于它无法通过连接之前不相关的事实来产生新知识。他说,即使拥有互联网上的大部分信息,按照我们目前对 AI 的理解,它主要是在填补人类已知之间的空白。
一些 AI 专家,包括前谷歌工程师 Francois Chollet,也表达了类似观点,认为虽然 AI 可能能够记忆推理模式,但不太可能基于新情况产生"新的推理"。
Wolf 认为 AI 实验室正在构建的本质上是"非常听话的学生" —— 而不是任何意义上的科学革命者。他说,今天的 AI 并不被激励去质疑和提出可能与其训练数据相悖的想法,这限制了它只能回答已知问题。
Wolf 认为 AI 领域的"评估危机"部分导致了这种令人失望的状况。他指出,目前用来衡量 AI 系统改进的基准测试大多包含那些有明确、显而易见和"封闭式"答案的问题。
作为解决方案,Wolf 建议 AI 行业"转向一种知识和推理的衡量方式",能够阐明 AI 是否能够采取"大胆的反事实方法",基于"微小提示"提出普遍性建议,并提出能导向"新研究路径"的"非显而易见的问题"。
Wolf 承认,找出这种衡量方式的具体形式将是一个难题。但他认为这可能是值得付出努力的。
Wolf 说:"科学最关键的方面是提出正确问题和挑战已学知识的能力。我们不需要一个能用常识回答每个问题的 A+ (AI) 学生。我们需要一个能看到并质疑其他人都忽略的内容的 B 级学生。"
好文章,需要你的鼓励
模型上下文协议(MCP)服务器是连接概率性大语言模型和确定性微服务工作流的关键节点,充当推理引擎与外部数据工具的翻译层。在生产环境中部署AI智能体时,MCP服务器承担着定义智能体能力、管理上下文数据和执行操作三大核心职责。由于其非确定性客户端特性,传统单元测试无法有效验证,需要通过端到端测试来确保系统可靠性,这使得MCP服务器成为智能体架构中不可或缺的关键基础设施。
SimWorld是由UCSD等多所顶尖院校联合开发的革命性AI仿真平台,基于虚幻引擎5构建了具备真实物理规律的虚拟城市环境。该平台支持无限扩展的程序化世界生成和自然语言交互,让AI智能体能够在复杂环境中学会生存、合作和竞争,为通用人工智能的发展提供了前所未有的训练平台。
英伟达推出Vera Rubin计算平台,专为驱动具备思考和推理能力的智能AI系统而设计。该平台采用NVL72液冷机架系统,集成六种芯片包括新Vera CPU和Rubin GPU。相比Blackwell架构,Rubin GPU推理速度提升5倍,训练速度提升3.5倍。平台还推出推理上下文内存存储解决方案,性能提升5倍。此外,英伟达还发布了面向自动驾驶的开源Alpamayo模型系列。
浙江大学联合华为提出C2DLM,这是一种因果概念引导的扩散语言模型,通过自动提取因果关系并融入注意力机制来增强AI推理能力。相比传统方法,C2DLM在推理任务上平均提升1.31%-12%,训练效率提高3.2倍,为解决语言模型推理能力不足开辟了新路径。