大约五年来首次,OpenAI 正在筹备推出一款真正“开放”的 AI 系统,也就是说,该系统可供免费下载,并且不再仅限于通过 API 调用。TechCrunch 周三报道指出,OpenAI 计划在初夏推出这一系统,目标性能力争超越 Meta 与 DeepSeek 的开放模型。
TechCrunch 获悉,除了在基准测试中的优异表现外,OpenAI 可能还隐藏着一项关键功能——这项功能或将令其开放“推理”模型具备极强竞争力。
两位熟悉内情的消息人士向 TechCrunch 表示,公司领导层正讨论使开放模型能够连接到 OpenAI 云托管模型的计划,以便更好地回答复杂查询。据其中一位消息人士透露,在最近一次与开源 AI 社区开发者举行的会议上,OpenAI 首席执行官 Sam Altman 将这一能力描述为“交接”。
OpenAI 未对 TechCrunch 的置评请求作出回应。
如果这一正如消息人士描述的功能被加入开放模型中,该模型便可调用 OpenAI API,从而借助公司其他更大型的模型获得显著的计算能力提升。目前尚不清楚该开放模型是否具备访问 OpenAI 模型所支持的部分工具(例如网络搜索和图像生成)的能力。
一位消息人士称,此次交接功能的构想是在 OpenAI 最近一次开发者论坛上由一位开发者提出的。该建议在公司内部似乎获得了认可。为了更好地塑造即将推出的开放模型,OpenAI 一直在与开发者举办一系列社区反馈活动。
能够调用更强大云端系统的本地模型让人不禁联想到 Apple Intelligence——苹果公司那套结合了设备端模型与运行在“private”数据中心模型的 AI 能力。显然,OpenAI 将从中受益。不仅能带来额外收入,交接功能还有望吸引更多开源社区的成员进入其高端生态系统。
目前对于 OpenAI 开放模型交接功能的具体实现方式仍存在诸多未知,包括定价策略与速率限制等。该模型仍处于早期阶段,其某些特性有可能发生变化或最终未能实现。
据消息人士告诉 TechCrunch,OpenAI 正在从零开始训练一款新模型用于开放发布,而非改造旧有模型。一位消息人士还表示,预计该开放模型在某些基准测试中的表现将略逊于 OpenAI 的 o3 模型,但在部分指标上将优于 DeepSeek 的 R1 推理模型。
好文章,需要你的鼓励
Carma Technology 针对 Uber 提起专利侵权诉讼,称其侵犯了涉及拼车系统的五项专利。案情回溯至十年前,凸显专利保护对创新者的重要性,可能对 Uber 及其他公司带来巨大影响。
东京大学研究团队开发的WebChoreArena是一个全新的网页代理评估基准,它包含532个精心设计的任务,专注于测试AI代理处理繁琐、复杂网页任务的能力。研究结果显示,即使是最先进的语言模型(如Gemini 2.5 Pro)在这些挑战性任务上的表现也比常规任务降低了约14个百分点,证明了这一基准有效区分了不同模型的能力。WebChoreArena通过设计海量记忆、计算、长期记忆等类型的任务,为评估AI代理在实际应用场景中的表现提供了更严格的标准。
经过暂停战略调整,Automattic 宣布重返 WordPress 开发,包括核心、Gutenberg、Playground 等模块,计划今年推出 6.9 版本,并涉及与 WP Engine 的法律争端。
这项研究提出了一种名为LIFT的新型微调方法,通过在低秩近似后识别大语言模型中的主要权重进行稀疏微调。研究表明,仅更新5%的主要权重就能在推理任务上超越全参数微调,同时保持与LoRA相当的内存效率。LIFT在常识推理、算术推理等多项任务上表现优异,还能更好地平衡学习新知识与保留原有能力。这一方法揭示了大语言模型中关键参数的重要性,为资源高效的模型定制提供了新思路。