Deep Cogito 推出混合型 AI "推理"模型

Deep Cogito公司推出了一系列开放可用的AI模型，这些模型可以在"推理"和非推理模式之间切换。这种混合架构结合了推理和标准非推理元素，能够快速回答简单问题，同时对复杂查询进行更深入的思考。公司声称其模型性能优于同等规模的开放模型，并计划在未来推出更大规模的版本。

一家名为 Deep Cogito 的新公司近期揭开面纱，推出了一系列可以在"推理"和非推理模式之间切换的开放 AI 模型。

像 OpenAI 的 o1 这样的推理模型在数学和物理等领域展现出巨大潜力，这要归功于它们能够通过逐步解决复杂问题来进行自我验证的能力。然而，这种推理能力是有代价的：更高的计算成本和延迟。这就是为什么像 Anthropic 这样的实验室正在追求"混合"模型架构，将推理组件与标准的非推理元素相结合。混合模型可以快速回答简单问题，同时在处理更具挑战性的问题时投入更多时间思考。

Deep Cogito 的所有模型（称为 Cogito 1）都是混合模型。该公司声称，这些模型的性能优于同等规模的最佳开放模型，包括来自 Meta 和中国 AI 初创公司 DeepSeek 的模型。

该公司在博客文章中解释道："每个模型都可以直接回答问题，或在回答前进行自我反思（类似推理模型）。所有这些都是由一个小团队在大约 75 天内开发完成的。"

Cogito 1 模型的参数规模从 30 亿到 700 亿不等，该公司表示，在未来几周和几个月内，将会推出参数规模达到 6710 亿的模型。参数数量大致对应于模型的问题解决能力，通常参数越多越好。

需要说明的是，Cogito 1 并非从零开始开发。Deep Cogito 是在 Meta 的开源 Llama 和阿里巴巴的 Qwen 模型基础上构建的。该公司表示，他们应用了新颖的训练方法来提升基础模型的性能，并实现可切换的推理能力。

根据 Cogito 的内部基准测试结果，最大的 Cogito 1 模型——启用推理功能的 Cogito 70B，在某些数学和语言评估中的表现优于 DeepSeek 的 R1 推理模型。在禁用推理功能的情况下，Cogito 70B 在通用 AI 测试 LiveBench 上的表现也超过了 Meta 最近发布的 Llama 4 Scout 模型。

所有 Cogito 1 模型都可以通过 Fireworks AI 和 Together AI 这两家云服务提供商的 API 下载或使用。

"目前，我们仍处于扩展曲线的早期阶段，仅使用了传统大语言模型后期/持续训练所需计算资源的一小部分，"Cogito 在其博客文章中写道。"展望未来，我们正在研究互补的后期训练方法来实现自我提升。"

根据加利福尼亚州的文件显示，总部位于旧金山的 Deep Cogito 成立于 2024 年 6 月。该公司的 LinkedIn 页面列出了两位联合创始人：Drishan Arora 和 Dhruv Malhotra。Malhotra 此前是 Google AI 实验室 DeepMind 的产品经理，负责生成式搜索技术。Arora 曾是 Google 的高级软件工程师。

根据 PitchBook 的信息，Deep Cogito 的投资方包括 South Park Commons，该公司雄心勃勃地致力于构建"通用超级智能"。公司创始人将这个术语理解为能够比大多数人更好地完成任务，并"发现我们尚未想象到的全新能力"的 AI。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Deep Cogito 推出混合型 AI "推理"模型

来源：Techcrunch

2025

04/09

23:10

分享

点赞

“4个9”韧性的背后，西云数据以技术与运营加速企业数字化创新

Google力推手机AI功能引发关注

Meta发布AI翻译功能，支持脸书和Instagram内容实时转换

HPE发布Nvidia Blackwell驱动的AI服务器，抢占AI市场需求

ISACA推出AI安全管理高级认证项目

谷歌推出智能体SOC系统提升安全事件响应速度

Lumen升级400GB数据中心连接基础设施助力AI发展

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

AI 创业者派遣虚拟分身出庭辩论，法官迅速叫停

Gemini Live 不仅仅是会对话的 AI，它现在有了"眼睛"。我亲自体验了一下

亚马逊推出新实时语音模型 Nova Sonic，面向第三方企业开发

Google 用 AI 魔法重塑《绿野仙踪》，打造全沉浸式 3D 体验

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

AI 遇见大型机：IBM Z17 大胆押注内幕

Starburst CEO: AI 领域的胜者在于数据访问能力

这家初创公司刚获得1.15亿美元融资，让工程设计速度提升1000倍 — 贝佐斯、奥特曼和英伟达都在押注其成功

ChatGPT 危险：5 件你绝不应该告诉 AI 机器人的事情

斯坦福的 AI 指数：重塑企业科技战略的 5 个关键洞察

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: