大语言模型已遭遇瓶颈，是时候重新定义智能了吗？

大语言模型和生成式AI自诞生以来问题频发，从推理模型表现不佳到AI幻觉现象，再到版权诉讼，这些都表明当前技术路径可能并非通往真正智能的正确道路。专家认为，仅靠增加数据和算力的扩展模式已显现边际效应递减，无法实现通用人工智能。研究者提出智能应包含统计、结构、推理和目标四个层次的协调，并强调时间因果性的重要性。面对LLM技术局限，业界开始探索神经符号AI等替代方案。

大语言模型和生成式 AI 技术自诞生以来遭遇的种种问题表明，这可能不是通向智能社会转型的正确路径。从最新推理模型的表现不佳，到 AI 幻觉现象的普遍存在，再到针对前沿模型的版权诉讼，这些都成为了定义这项技术的关键事件。

重新定义智能

2018年，Geoffrey Hinton 在开发深度学习以模仿人类决策时曾表示，监管机构要求 AI 系统解释其决策过程将是"彻底的灾难"，因为人类自己也无法完全解释自己的决策过程。他解释说："人们无法解释自己如何工作，对于他们所做的大部分事情都是如此。当你雇用某人时，决策基于各种无法量化的因素，以及各种直觉感受。人们根本不知道自己是如何做到这一点的。"

纽约大学名誉教授、认知科学家 Gary Marcus 长期以来一直是大语言模型的知名批评者。他在最近的《纽约时报》专栏文章中指出："GPT-5 虽然是一个进步，但远未达到许多人期望的 AI 革命。这对于在这项技术上下重注的公司和投资者来说是个坏消息。"

Marcus 驳斥了 AI 的目标是复制人类智能的观点，他说："人类仍然做着机器不能很好完成的许多事情，比如学习新技能和用抽象概念进行推理。我们的思维具有流动性和灵活性，这是 AI 仍然缺乏的。"

30年 AGI 研究资深专家、EraNova Global 创始人 Mounir Shita 开发了基于物理学的通用智能理论。他将智能定义为在物理约束下"引导因果链朝向目标状态"的能力。

系统思维专家 Marc Fawzi 构建了首个面向电信服务提供商的商业化低代码平台。他认为复制人类智能不仅仅是计算问题，并解释了定义 AI 运作的分层系统：第一层是统计层，认知依赖于历史事件；第二层是结构层，识别概念系统内的相似性和约束；第三层是推理层；第四层是目标层，定义偏好、风险和权衡。

数据中心扩张竞赛

Marcus 指出，OpenAI 在介绍 o1 时首次展示的通过扩展推理计算来改善模型性能的图表引起了兴奋，人们相信更多的计算（财务成本和能源使用）会产生更智能的模型。然而，"计算需要呈指数级增长才能保持持续进步"，这意味着问题变得难以控制。

麦肯锡最近报告称，到2030年，"全球数据中心预计需要6.7万亿美元来跟上对计算能力的需求。"仅资本支出就预计达到5.2万亿美元。

大语言模型不是答案

据 Shita 说，语言属于 AGI 的核心知识库，但大语言模型不属于。他解释说："大语言模型被训练来最大化离线文本的下一个Token可能性。它们建模的是关于世界的词汇，而不是这些词汇必须改变的世界。"

Fawzi 同意 Shita 的观点，认为大语言模型本身不是答案。他补充说："仅有的语言流利性不等于知识。词汇模式不会自动成为世界模式。"

Marcus 总结道："整个范式基本上是一种增强版的反刍。并非所有需要的内容都在训练集中。当训练集中没有相关内容，或者与训练数据在重要方面存在差异时，这种范式效果不佳。"

替代模型

Marcus 指出了从大语言模型向"传统符号操作设备如代码解释器Python、JavaScript"的转变。他最近写道，Grok和o3意外地证明了神经符号AI的价值。

Shita 坚持认为时间和因果关系对智能也至关重要。目标与我们想要实现的世界未来状态相关联，因此从根本上与时间相关。他解释说："要改变世界上的任何事物，你必须理解因果关系——因果效应的规律。"

通往AGI的道路有待确定

Gary Marcus 认为，至少目前我们应该放弃AGI，转而专注于解决专门问题的专用机器。他提到了预测蛋白质结构的AlphaFold作为例子。

Mounir Shita 声称计算机是100%确定性的，"给定输入、代码和状态，下一个状态是固定的。自由意志无法从确定性机器中产生。"

目前，随着许多AI研究社区一致认为当前主流的大语言模型技术不是最终答案，时间将证明为确保其未来而进行的大规模投资是否也会失败。

Q&A

Q1：为什么说大语言模型遭遇了瓶颈？

A：大语言模型自诞生以来遭遇了许多问题，包括最新推理模型表现不佳、AI幻觉现象普遍存在、版权诉讼增多等。专家认为仅通过增加数据和计算力已经出现收益递减，GPT-5等模型的表现远未达到预期，证明这可能不是通向真正智能的正确路径。

Q2：什么是真正的智能？如何定义？

A：专家们对智能有不同定义。Mounir Shita将智能定义为在物理约束下"引导因果链朝向目标状态"的能力。Marc Fawzi认为智能需要统计、结构、推理和目标四个层面的协调。Gary Marcus强调人类思维的流动性和灵活性是AI仍然缺乏的，真正的智能不仅仅是复制人类行为。

Q3：有哪些替代大语言模型的技术路径？

A：专家们提出了多种替代方案。Marcus倡导神经符号AI，结合符号操作和代码解释器；Shita强调时间和因果关系的重要性，认为需要动态更新的模型；Fawzi提出需要跨领域和时间的统一世界模型。许多专家建议回到专用机器解决专门问题的方法，如AlphaFold在蛋白质结构预测方面的成功。

来源：Forbes

0赞

好文章，需要你的鼓励

大语言模型已遭遇瓶颈，是时候重新定义智能了吗？

来源：Forbes

2025

10/09

08:08

分享

点赞

智算前沿 焕芯未来—MINISFORUM 与 AMD 联合举办AI 双旗舰产品体验会

锐龙9高端游戏本突破百万销量 京东“超级供应链”成AMD 增长强引擎

西门子发布数据中心解决方案5.0，创新型直流配电产品首次亮相中国市场

研究人员利用300万天Apple Watch数据训练疾病检测AI

CoreWeave CEO 为 AI 循环交易辩护称其为"协作共赢"

IT领导者不可忽视的生成式AI价值实现五大趋势

AI安全监管亟待加强，头部科技公司评分不及格

TPU挑战GPU霸主地位，谷歌专用芯片崛起

2026年AI预测：自动化发展与工作未来的十大趋势

亚马逊计划2030年前在印度投资350亿美元聚焦AI与物流

Adobe将Photoshop、Acrobat和Adobe Express集成至ChatGPT

Google DeepMind与Apptronik展示家用人形机器人执行真实世界任务

微软推出智能体模式，让办公软件变身"氛围工作"助手

DeepSeek发布稀疏注意力技术降低AI推理成本

ServiceNow押注AI优先界面将定义企业AI未来

AI时代数据中心液冷技术变革与热管理策略演进

Zayo与Equinix联合发布AI基础设施架构框架

数据中心的智算挑战，英特尔要如何应对？

OpenAI将发布类似TikTok的社交应用，搭配Sora 2视频模型

微软推出Office智能体模式让用户"氛围办公"

AI助手现在能帮你创建高质量Word文档和Excel表格

高通新一代骁龙平台将推动智能体AI时代到来

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

智算前沿焕芯未来—MINISFORUM 与 AMD 联合举办AI 双旗舰产品体验会

锐龙9高端游戏本突破百万销量京东“超级供应链”成AMD 增长强引擎