OpenAI在国际数学奥林匹克竞赛中取得了"金牌级别的表现",为人工智能的快速发展再添重要里程碑。OpenAI研究科学家Alexander Wei在社交媒体上发布消息称,一个实验性研究模型成功解决了这一"人工智能领域长期存在的重大挑战"。
据Wei介绍,OpenAI一款未发布的模型能够解决这项世界上历史最悠久、最负盛名的数学竞赛中六道题目中的五道,总共获得42分中的35分。国际数学奥林匹克竞赛(IMO)由各国选派最多六名学生参赛,解决极其困难的代数和微积分预备知识问题。这些练习题看似简单,但通常需要一定的创造性才能在每道题上获得最高分。在今年的竞赛中,630名参赛者中只有67人获得金牌,约占总人数的10%。
人工智能通常被用来处理复杂数据集和重复性任务,但在解决需要更多创造性或复杂决策的问题时往往表现不佳。然而,通过最新的IMO竞赛,OpenAI表示其模型能够运用类似人类的推理能力处理复杂的数学问题。
Wei在社交媒体上写道:"通过这样做,我们获得了一个能够构建精密、严密论证的模型,其水平达到了人类数学家的程度。" Wei和OpenAI首席执行官Sam Altman都表示,公司预计在未来几个月内不会发布具有这种数学能力水平的产品。这意味着即将推出的GPT-5相比前代产品会有所改进,但不会具备在IMO竞赛中竞争的同等令人印象深刻的能力。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。