OpenAI实验模型在国际数学奥林匹克竞赛中获得金牌级表现

OpenAI研究科学家Alexander Wei宣布，公司一个未发布的实验模型在国际数学奥林匹克竞赛中解决了六道题目中的五道，获得42分中的35分，达到金牌水平。该模型展现出类似人类数学家的推理能力，能够构建复杂严密的论证。这标志着AI在创造性问题解决方面的重要突破，不过该技术预计数月内不会公开发布。

OpenAI在国际数学奥林匹克竞赛中取得了"金牌级别的表现"，为人工智能的快速发展再添重要里程碑。OpenAI研究科学家Alexander Wei在社交媒体上发布消息称，一个实验性研究模型成功解决了这一"人工智能领域长期存在的重大挑战"。

据Wei介绍，OpenAI一款未发布的模型能够解决这项世界上历史最悠久、最负盛名的数学竞赛中六道题目中的五道，总共获得42分中的35分。国际数学奥林匹克竞赛（IMO）由各国选派最多六名学生参赛，解决极其困难的代数和微积分预备知识问题。这些练习题看似简单，但通常需要一定的创造性才能在每道题上获得最高分。在今年的竞赛中，630名参赛者中只有67人获得金牌，约占总人数的10%。

人工智能通常被用来处理复杂数据集和重复性任务，但在解决需要更多创造性或复杂决策的问题时往往表现不佳。然而，通过最新的IMO竞赛，OpenAI表示其模型能够运用类似人类的推理能力处理复杂的数学问题。

Wei在社交媒体上写道："通过这样做，我们获得了一个能够构建精密、严密论证的模型，其水平达到了人类数学家的程度。" Wei和OpenAI首席执行官Sam Altman都表示，公司预计在未来几个月内不会发布具有这种数学能力水平的产品。这意味着即将推出的GPT-5相比前代产品会有所改进，但不会具备在IMO竞赛中竞争的同等令人印象深刻的能力。

来源：engadget

0赞

好文章，需要你的鼓励

OpenAI实验模型在国际数学奥林匹克竞赛中获得金牌级表现

来源：engadget

2025

07/21

10:29

分享

点赞

高性能 AI 边缘推理服务器MIC-743-AT

Instagram长视频内容和个性化订阅可能即将到来

NVIDIA DGX Spark

Dell Pro Max with GB10

至顶AI实验室硬核评测：戴尔 Precision 5490移动工作站搭建Open Deep Research，打造专属于你的全流程AI研究助手

惠普ZBook Fury G1i高性能移动工作站

至顶AI实验室硬核评测：夸克 AI 眼镜全链路"无切换体验"，当AI助手真正走进日常

夸克AI眼镜

至顶AI实验室硬核评测：据说这就是AI手机的形态，贴脸开大，豆包手机上手评测

OpenFlex(TM) Data24 NVMe-oF(TM) 存储平台

英特尔(R) 至强(R) 6776P处理器

Solidigm D7-PS1010 E1.S 液冷固态硬盘

AGI和AI超级智能证明智能所需回答的问题数量

AI在商业中的正确用量

AnyCoder：基于Kimi K2的快速Web应用开发工具发布

隐私安全需三思：AI获取个人数据权限的风险与挑战

Cursor收购企业初创公司Koala挑战GitHub Copilot

Cartken转向工业机器人：从末端配送到工厂自动化的商业策略转变

开发者对MCP协议应关注的5个核心问题

AI热潮下数据中心液冷技术的可持续发展趋势

从工具到队友：AI智能体将成为数字化劳动力

Docker统一容器开发与AI智能体工作流程

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: