OpenAI表示,其最新推理模型已独立完成一项原创数学证明,成功推翻了几何学领域一个长期悬而未决的著名猜想。这一猜想最初由数学家保罗·埃尔德什于1946年提出。
如果你觉得这个消息似曾相识,那是因为这并非OpenAI第一次发出如此大胆的声明。七个月前,这家AI巨头的前副总裁凯文·韦尔曾在X平台发帖称:"GPT-5找到了10个(!)此前悬而未决的埃尔德什问题的解法,并在另外11个问题上取得了进展。"
然而事后证明,GPT-5并未真正解决那些问题,它只是在已有文献中找到了现成的解答。
此事随即引发了竞争对手的公开嘲讽,包括扬·勒坤以及谷歌DeepMind首席执行官德米斯·哈萨比斯。韦尔随后迅速删除了那篇言之过早的帖子。而这一次,OpenAI似乎没有重蹈覆辙。伴随本次公告,OpenAI同步发布了多位数学家的支持性评论,其中包括诺加·阿隆、梅勒妮·伍德,以及埃尔德什问题网站的维护者托马斯·布鲁姆——后者此前曾将韦尔的那篇帖子定性为"严重的错误表述"。
"近80年来,数学家们普遍认为最优解的形式大致类似于方格网络,"OpenAI在X平台上写道,"而OpenAI的模型现在已经推翻了这一认知,发现了一类全新的构型,其性能表现更为出色。"
OpenAI表示,此次突破标志着"AI首次自主解决了数学某一核心领域中一个重要的开放性问题"。据悉,这一证明来自一个新型通用推理模型,而非专门为解决数学问题甚至这一特定问题而设计的系统。
OpenAI认为,这一成果具有重要意义,因为它表明AI系统如今已能够更好地维系复杂的长链推理,并以研究人员此前可能未曾探索的方式将不同领域的思路融会贯通。这对生物学、物理学、工程学和医学等领域都具有深远影响。
"AI正在帮助我们更充分地探索人类数百年来构筑的数学殿堂,"布鲁姆在声明中表示,"还有哪些不为人知的奇迹正在等待被发现?"
Q&A
Q1:OpenAI这次解决的埃尔德什猜想具体是什么问题?
A:这个猜想由数学家保罗·埃尔德什于1946年提出,属于几何学领域的经典难题。近80年来,数学家们普遍认为该问题的最优解形式大致类似于方格网络结构。OpenAI的推理模型通过原创证明推翻了这一长期认知,发现了一类性能更优的全新构型,从而完成了对该猜想的否证。
Q2:OpenAI之前声称GPT-5解决了埃尔德什问题,这次和上次有什么不同?
A:上次,OpenAI前副总裁凯文·韦尔宣称GPT-5解决了10个埃尔德什问题,但事后证明模型只是找到了文献中已有的现成解答,并非真正意义上的原创突破,随即遭到数学家和竞争对手的批评。而这一次,OpenAI同步发布了多位知名数学家的支持性声明,证明此次推理模型完成的是真正原创的数学证明。
Q3:完成这次数学证明的是什么模型?它是专门为解数学题设计的吗?
A:完成这次证明的是OpenAI推出的一个新型通用推理模型,并非专门为解决数学问题或这一特定猜想而定制的系统。OpenAI表示,这说明AI在维系复杂长链推理、跨领域融合思路方面的能力已显著提升,对生物学、物理学、工程学和医学等领域都具有潜在影响。
好文章,需要你的鼓励
Paramount正加速推进AI布局,同时面临CTO Phil Wiser五月底计划离职的人事变动。在收购华纳兄弟探索公司接近尾声之际,Paramount CIO Lakshman Nathan在路透社举办的Momentum AI大会上分享了公司AI战略:公司已在隐私、法务及代码开发等领域部署AI,两天内即可完成应用测试交付。Paramount采取开放探索与治理并行的策略,借助智能体AI推动企业级应用整合,同时稳步处理多次并购带来的遗留系统问题。
BEAM是阿里巴巴与北京大学提出的MoE大模型动态路由方法,通过可学习的二值掩码实现每个词自适应选择激活专家数量,在保留98%性能的前提下将推理速度提升最高2.5倍。
量子计算行业正面临两大迫切问题:安全威胁与人才短缺。随着"Q-Day"临近,量子计算机或将破解RSA加密体系,威胁银行、医疗、政府等关键基础设施安全。NIST要求2035年前完成向后量子密码学的迁移。与此同时,行业人才严重匮乏——目前仅有3万名量子专业人员,而2029年需求将达25万人。据麦肯锡预测,量子计算到2035年将创造3万亿美元经济机遇。
CurveBench是由四所高校联合构建的视觉拓扑推理基准,通过让AI识别嵌套闭合曲线的层次包含关系,揭示了顶尖视觉语言模型在空间结构理解上的系统性缺陷。