OpenAI表示,其最新推理模型已独立完成一项原创数学证明,成功推翻了几何学领域一个长期悬而未决的著名猜想。这一猜想最初由数学家保罗·埃尔德什于1946年提出。
如果你觉得这个消息似曾相识,那是因为这并非OpenAI第一次发出如此大胆的声明。七个月前,这家AI巨头的前副总裁凯文·韦尔曾在X平台发帖称:"GPT-5找到了10个(!)此前悬而未决的埃尔德什问题的解法,并在另外11个问题上取得了进展。"
然而事后证明,GPT-5并未真正解决那些问题,它只是在已有文献中找到了现成的解答。
此事随即引发了竞争对手的公开嘲讽,包括扬·勒坤以及谷歌DeepMind首席执行官德米斯·哈萨比斯。韦尔随后迅速删除了那篇言之过早的帖子。而这一次,OpenAI似乎没有重蹈覆辙。伴随本次公告,OpenAI同步发布了多位数学家的支持性评论,其中包括诺加·阿隆、梅勒妮·伍德,以及埃尔德什问题网站的维护者托马斯·布鲁姆——后者此前曾将韦尔的那篇帖子定性为"严重的错误表述"。
"近80年来,数学家们普遍认为最优解的形式大致类似于方格网络,"OpenAI在X平台上写道,"而OpenAI的模型现在已经推翻了这一认知,发现了一类全新的构型,其性能表现更为出色。"
OpenAI表示,此次突破标志着"AI首次自主解决了数学某一核心领域中一个重要的开放性问题"。据悉,这一证明来自一个新型通用推理模型,而非专门为解决数学问题甚至这一特定问题而设计的系统。
OpenAI认为,这一成果具有重要意义,因为它表明AI系统如今已能够更好地维系复杂的长链推理,并以研究人员此前可能未曾探索的方式将不同领域的思路融会贯通。这对生物学、物理学、工程学和医学等领域都具有深远影响。
"AI正在帮助我们更充分地探索人类数百年来构筑的数学殿堂,"布鲁姆在声明中表示,"还有哪些不为人知的奇迹正在等待被发现?"
Q&A
Q1:OpenAI这次解决的埃尔德什猜想具体是什么问题?
A:这个猜想由数学家保罗·埃尔德什于1946年提出,属于几何学领域的经典难题。近80年来,数学家们普遍认为该问题的最优解形式大致类似于方格网络结构。OpenAI的推理模型通过原创证明推翻了这一长期认知,发现了一类性能更优的全新构型,从而完成了对该猜想的否证。
Q2:OpenAI之前声称GPT-5解决了埃尔德什问题,这次和上次有什么不同?
A:上次,OpenAI前副总裁凯文·韦尔宣称GPT-5解决了10个埃尔德什问题,但事后证明模型只是找到了文献中已有的现成解答,并非真正意义上的原创突破,随即遭到数学家和竞争对手的批评。而这一次,OpenAI同步发布了多位知名数学家的支持性声明,证明此次推理模型完成的是真正原创的数学证明。
Q3:完成这次数学证明的是什么模型?它是专门为解数学题设计的吗?
A:完成这次证明的是OpenAI推出的一个新型通用推理模型,并非专门为解决数学问题或这一特定猜想而定制的系统。OpenAI表示,这说明AI在维系复杂长链推理、跨领域融合思路方面的能力已显著提升,对生物学、物理学、工程学和医学等领域都具有潜在影响。
好文章,需要你的鼓励
Google Messages近期对聊天界面进行了调整,在"默认"主题下,语音备忘录按钮的波形图标采用了动态颜色的第三强调色进行主题化显示,同时支持浅色与深色模式,更换系统主题或壁纸时背景色也会随之更新。此前该按钮与输入框颜色保持一致。目前该变化仅见于稳定版20260523_00_RC00,尚不确定是有意调整还是程序错误。
SIA是Hexo Labs提出的首个同时自动更新AI操作手册和模型权重的自我进化系统,在法律、GPU优化和生物信息学三个领域均超越了此前最优结果。
Telegram近期更新中悄然带回了对Wear OS智能手表的支持,距上次停用该应用已过去五年。新应用支持浏览聊天记录、发送和收听语音消息、静音及置顶对话等功能,首次将Telegram带到Pixel Watch和Galaxy Watch平台。目前Wear OS版暂不支持查看位置和发送贴纸,但官方表示将在下一次更新中补齐。此外,本次更新还改进了机器人文本格式、投票选项链接及Markdown文件支持等功能。
清华大学等机构提出LIMMT框架,通过三阶段数据筛选,用仅3%的动作数据训练人形机器人,追踪效果超越全量数据训练。