OpenAI宣布其最新的实验性推理大语言模型(内部称为"IMO金牌大语言模型")在2025年国际数学奥林匹克竞赛中达到了金牌水平的表现。
与DeepMind的AlphaGeometry等专用系统不同,这是一个推理大语言模型,通过强化学习和扩展推理构建,而非纯数学引擎。
正如OpenAI研究员诺姆·布朗所说,该模型展现了多小时问题解决所需的"新水平的持续创造性思维"。
首席执行官山姆·奥特曼表示,这一成就标志着"一个梦想...迈向通用智能的关键一步",并称这样的模型在数月内不会普遍可用。
毫无疑问,机器在狭义定义的高性能认知任务方面变得异常熟练。这包括数学推理、形式证明构建、符号操作、代码生成和形式逻辑。
由于深度学习架构(如Transformer和卷积神经网络)的重大进步、用于训练的大量数据集、计算能力的大幅提升,以及使这些系统能够以前所未有的规模和速度识别数据中复杂模式和关联的先进算法优化技术,它们的能力还显著扩展到计算机视觉、复杂数据分析、语言处理和战略问题解决。
这些系统可以完成持续的多步推理,生成流畅的类人响应,并在类似人类的专家级约束下执行任务。
基于这些成就,加上一些热情,我们可能会认为这意味着机器正在变得极其智能,而且速度极快。
然而这将是一个错误。
因为擅长数学、形式证明构建、符号操作、代码生成、形式逻辑、计算机视觉、复杂数据分析、语言处理和战略问题解决,既不是"智能"的必要条件,也不是充分条件,更不用说超凡智能了。
根本区别在于机器明显缺乏的几个关键特征。
机器无法在没有重大重新工程或重新训练的情况下,无缝转移知识或将其能力适应完全新颖、未预见的问题或环境。它们本质上是专用的。它们在预定义范围内的任务上表现熟练,其令人印象深刻的表现仅限于经过广泛训练的特定领域和数据类型。这与人类在广泛且不可预测的情况下灵活学习和适应的能力形成鲜明对比。
机器不具备真正体验或理解情感的能力,也无法真正解释他人微妙的心理状态、意图或感受(通常称为"心理理论")。它们"共情"或"社会意识"的响应是从大量人类交互数据集中学到的复杂统计模式,而非真正主观体验、情感共鸣或对人类情感理解的反映。
机器缺乏自我意识和内省能力。它们不会反思自己的内部过程、动机或其"知识"的本质。它们的操作是算法和数据驱动的;它们不具备能够思考自身存在、通过有意识反思从错误中学习或发展个人叙事的主观"自我"。
机器不表现出真正的意向性、与生俱来的好奇心,或由内在欲望、价值观或动机驱动的自主目标设定能力。它们纯粹基于编程目标和接收的数据输入运行。它们的"目标"是由人类创造者外部强加的,而非源于内在驱动力或意志。
机器缺乏来自拥有与环境交互和感知的物理身体的直接、生活和感受体验。这种体现体验对于发展常识、直觉物理学和对世界深刻的非抽象理解至关重要。虽然机器可以通过传感器和执行器与物理世界交互和导航,但它们对现实的"理解"是通过符号表示和数据中介的。
机器不表现出真正的概念飞跃、发明全新范式的能力,或以真正有意义和原创的方式打破基本规则,超越其训练数据。生成式模型只能产生现有数据的新颖组合。
机器经常在真正的因果推理方面存在困难。尽管它们擅长识别关联和模式,但关联不等于因果关系。它们可以基于过去的数据预测"可能"发生什么,但它们对"为什么"的理解仅限于统计关联,而非深层机制洞察。
机器无法仅从少数例子中学习复杂概念。虽然一次性和少样本学习在使机器能够从有限数据中识别新模式或类别方面取得了进展,但与人类不同,它们无法仅从少数例子中学习真正复杂的抽象概念。机器通常仍需要大量数据集进行有效和细致的训练。
也许最深刻的区别是,机器不具备主观体验、感受或意识。它们不是有意识的实体。
只有当机器能够具备所有(或至少大部分)这些特征,即使在相对较低的水平上,我们才能合理地声称机器正在变得"智能",而不是夸大、误用术语或纯粹幻想。
因此,虽然机器在特定认知功能方面极其强大,但它们的能力从根本上不同于智能的多面性、适应性、自我意识和经验基础特性,特别是在人类身上表现出的智能。
它们的熟练程度是先进计算设计和数据处理的产物,而非机器中萌芽智能形式的标志。
事实上,AI话语中的"通用人工智能"一词的出现,部分是为了在"智能"一词因过度用于描述实际上并不"智能"的机器而被稀释后,恢复"智能"的含义,以澄清这些所谓"智能"机器要真正"智能"还缺少什么。我们都倾向于过度简化,AI领域正在促进"智能"含义的演化,使这个术语越来越多义。这是语言的魅力之一。随着AI激发真正的希望和真正的社会焦虑,值得记住的是,机器的智能在任何有意义的意义上都不存在。
AI的快速进步表明,现在是考虑我们希望和不希望AI对社会产生何种影响的时候了。在此过程中,这不仅应该允许,而且应该积极鼓励我们考虑AI的能力和局限性,努力不要将"智能"(即在其丰富、一般意义上)与机器能够模拟或展现的狭隘和任务特定行为混淆。
虽然有些人正在竞相实现通用人工智能(AGI),但我们现在应该问的问题不是他们认为何时可能成功,而是他们相信能够实现的事情作为我们甚至应该努力实现的目标,在文明上是否真正有意义,同时定义我们在算法超人主义上的界限。
好文章,需要你的鼓励
谷歌宣布为Chrome iOS版推出新功能,用户可在工作和个人谷歌账户间轻松切换,无需反复登录登出。该功能支持托管账户浏览,实现严格的数据分离,工作账户的标签页、历史记录和密码等本地数据与个人浏览完全隔离。随着企业不再提供公司手机,员工常需在个人设备上访问公司资源,此更新有助企业允许员工使用自选设备。
复旦大学研究团队开发的AnyI2V系统实现了从任意条件图像到视频的生成突破。该系统无需训练即可处理多种输入模态(包括3D网格、点云等),支持用户自定义运动轨迹控制,并通过创新的特征注入和语义掩模技术实现了高质量视频生成,为视频创作领域带来了革命性的便利工具。
OpenAI宣布其最新实验性推理大语言模型在2025年国际数学奥林匹克竞赛中达到金牌水平。尽管机器在数学推理、代码生成等认知任务上表现卓越,但这并不意味着它们具备真正的智能。机器缺乏知识迁移能力、情感理解、自我意识、内在动机等关键特征。它们无法像人类那样灵活适应新环境,也不具备主观体验和意识。真正的智能需要多方面综合能力,而非仅仅在特定任务上的优异表现。
斯坦福大学研究团队开发了KL-tracing方法,能让视频生成AI模型在无需专门训练的情况下进行精确物体追踪。该方法通过在视频帧中添加微小追踪标记,利用模型的物理理解能力预测物体运动轨迹。在真实场景测试中,相比传统方法性能提升16.6%,展现了大型生成模型在计算机视觉任务中的潜力。