知名科技媒体theverge消息,OpenAI将在ChatGPT发布两周年之际12月左右,推出传说中的大模型——Orion(猎户座)。
据内部人士透露,Orion会使用o1模型生成的合成数据进行预训练,还会使用一些其他类型的模型混合在一起使用,性能比GPT-4强100倍非常接近AGI。
但发布流程和之前不太一样,OpenAI会先分享给技术合作伙伴,帮助他们开发具有竞争性的生成式AI产品或优先使用权。例如,微软的工程师正筹备在Azure云上提供Orion托管服务,预计11月底就能上线。
该消息发布后,OpenAI首席执行官Sam Altman说这是一个假消息,但没有给出合理的解释。于是遭到了大量网友的质疑。
有网友表示,既然这个是假新闻,那你说它假在哪里?为什么偏偏针对Kylie,而不是其他报道过OpenAI的记者?
好吧,越辟谣,这事就越实锤了。
Sam你不喜欢新闻泄漏是吧,不幸的是船已经开始沉没,四处发散了。
Sam你能说出这个消息假在哪里吗?不是有一个叫Orion的项目存在吗?
有时候刻意的否定消息,更像是变相的肯定它的存在。
每次你辟谣假新闻,最后都成真的了。
你曾经说过GPT-4将是最笨的模型,当媒体说Orion在两年后发布新旗舰模型,比GPT-4强大100倍时,你为啥又说他们是假的了呢?
此外,Sam在这条推文下面的回复也很奇怪,他说了很多无厘头的话与他平时风格不符,让很多人觉得他的账号又被智能体托管了。
如果上面的只是字面的质疑,那下面这个可是实锤的证据,并且还让o1根据Sam的字谜进行了精准解读,最后得出的结论就是在12月发布Orion模型。
今年9月14日,Sam曾发布了一篇推文“我喜欢在中西部的家。夜空真美。很期待冬季星座的升起,它们真是太棒了。”(这是他的习惯,在每次发布重要产品时,都喜欢给个字谜让大家来猜)
英文就是“i love being home in the midwest. the night sky is so beautiful. excited for the winter constellations to rise soon; they are so great.”
当把这段话放到ChatGPT-o1里,然后提问,“这句话里隐藏里哪些内容?”
ChatGPT的回答:这段话隐藏了“Orion”这个词。在最后一句中,很期待冬季星座的升起,它们真是太棒了。这个短语暗示星座很伟大。
将“they are so great”中的字母重新排列,可以形成“Orion”这个词。
所以,隐藏的信息是“猎户座”,一个在冬季天空中可见的星座。
经典的Sam推文,给出谜面让大家猜OpenAI下一个发布的模型是什么。
当时已经有网友想到了这个谜底,认为12月将会发布GPT-5 Orion。
Orion即将到来,OpenAI继续引领技术潮流。
擅长营销的Sam好像这次有点玩脱了,极力的辟谣却引来了反面效果。从9月的暗示到现在的媒体报道以及微软的实际行动,大家更愿意相信12月Orion猎户座的到来。估计让他不爽的就是,这么重磅的消息应该由他或OpenAI爆料而不是第三方。
正如前面网友所说的,船一旦开始漏水沉没时,真真假假已经不重要,人们更喜欢看到他们想要的东西。情绪价值在这一刻犹如洪水猛兽,变得一发不可收拾。
好文章,需要你的鼓励
这项研究提出了R1-Searcher++框架,通过两阶段训练策略使大语言模型能像人类一样灵活利用内部知识和外部信息。该方法创新性地采用强化学习激励模型优先使用内部知识,并引入记忆机制将检索到的信息转化为内部知识,实现动态知识获取。实验表明,R1-Searcher++不仅在多步问答任务上表现优异,还大幅减少了检索次数,显著提高了推理效率。
这项研究提出了AutoRefine,一种革新性的强化学习框架,为大语言模型引入了"边思考边搜索和完善"的全新范式。与传统方法不同,AutoRefine在连续搜索调用之间添加知识完善步骤,让模型能够有效过滤和组织信息。通过结合答案正确性和检索质量双重奖励,该方法在七项问答基准测试中平均提升6.9%的准确率,特别在复杂多跳推理场景中表现突出,解决了现有检索增强推理的核心局限性。
这项研究揭示了一种新型网络安全威胁:利用普通网络广告攻击AI网页代理。中科院研究团队开发的AdInject攻击无需特殊权限,仅通过精心设计的广告内容就能误导AI代理点击恶意链接,成功率高达90%以上。研究使用严格的黑盒模型,更符合现实场景,暴露了当前AI代理面临的实际安全漏洞。实验还表明,即使添加专门的防御提示,这类攻击仍能成功率超过50%,凸显了设计更强大防御机制的紧迫性。
东北大学与快手科技联合研发的UNITE系统为多模态信息检索带来突破性进展。这项发表于2025年5月的研究首次系统分析了模态特定数据如何影响检索性能,并提出创新的模态感知掩码对比学习技术,有效解决不同模态间的竞争关系。UNITE能同时处理文本、图像、视频及其组合,在40多项测试中超越现有方法,即使与参数规模更大的模型相比也表现出色。研究发现视频-文本对在通用检索中表现优异,而文本-文本和文本-图像对对指令遵循任务至关重要,为未来多模态系统研究提供了宝贵指南。