Deep Cogito 推出混合型 AI "推理"模型

Deep Cogito公司推出了一系列开放可用的AI模型，这些模型可以在"推理"和非推理模式之间切换。这种混合架构结合了推理和标准非推理元素，能够快速回答简单问题，同时对复杂查询进行更深入的思考。公司声称其模型性能优于同等规模的开放模型，并计划在未来推出更大规模的版本。

一家名为 Deep Cogito 的新公司近期揭开面纱，推出了一系列可以在"推理"和非推理模式之间切换的开放 AI 模型。

像 OpenAI 的 o1 这样的推理模型在数学和物理等领域展现出巨大潜力，这要归功于它们能够通过逐步解决复杂问题来进行自我验证的能力。然而，这种推理能力是有代价的：更高的计算成本和延迟。这就是为什么像 Anthropic 这样的实验室正在追求"混合"模型架构，将推理组件与标准的非推理元素相结合。混合模型可以快速回答简单问题，同时在处理更具挑战性的问题时投入更多时间思考。

Deep Cogito 的所有模型（称为 Cogito 1）都是混合模型。该公司声称，这些模型的性能优于同等规模的最佳开放模型，包括来自 Meta 和中国 AI 初创公司 DeepSeek 的模型。

该公司在博客文章中解释道："每个模型都可以直接回答问题，或在回答前进行自我反思（类似推理模型）。所有这些都是由一个小团队在大约 75 天内开发完成的。"

Cogito 1 模型的参数规模从 30 亿到 700 亿不等，该公司表示，在未来几周和几个月内，将会推出参数规模达到 6710 亿的模型。参数数量大致对应于模型的问题解决能力，通常参数越多越好。

需要说明的是，Cogito 1 并非从零开始开发。Deep Cogito 是在 Meta 的开源 Llama 和阿里巴巴的 Qwen 模型基础上构建的。该公司表示，他们应用了新颖的训练方法来提升基础模型的性能，并实现可切换的推理能力。

根据 Cogito 的内部基准测试结果，最大的 Cogito 1 模型——启用推理功能的 Cogito 70B，在某些数学和语言评估中的表现优于 DeepSeek 的 R1 推理模型。在禁用推理功能的情况下，Cogito 70B 在通用 AI 测试 LiveBench 上的表现也超过了 Meta 最近发布的 Llama 4 Scout 模型。

所有 Cogito 1 模型都可以通过 Fireworks AI 和 Together AI 这两家云服务提供商的 API 下载或使用。

"目前，我们仍处于扩展曲线的早期阶段，仅使用了传统大语言模型后期/持续训练所需计算资源的一小部分，"Cogito 在其博客文章中写道。"展望未来，我们正在研究互补的后期训练方法来实现自我提升。"

根据加利福尼亚州的文件显示，总部位于旧金山的 Deep Cogito 成立于 2024 年 6 月。该公司的 LinkedIn 页面列出了两位联合创始人：Drishan Arora 和 Dhruv Malhotra。Malhotra 此前是 Google AI 实验室 DeepMind 的产品经理，负责生成式搜索技术。Arora 曾是 Google 的高级软件工程师。

根据 PitchBook 的信息，Deep Cogito 的投资方包括 South Park Commons，该公司雄心勃勃地致力于构建"通用超级智能"。公司创始人将这个术语理解为能够比大多数人更好地完成任务，并"发现我们尚未想象到的全新能力"的 AI。

来源：Techcrunch

0赞

好文章，需要你的鼓励

Deep Cogito 推出混合型 AI "推理"模型

来源：Techcrunch

2025

04/09

23:10

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

AI 创业者派遣虚拟分身出庭辩论，法官迅速叫停

Gemini Live 不仅仅是会对话的 AI，它现在有了"眼睛"。我亲自体验了一下

亚马逊推出新实时语音模型 Nova Sonic，面向第三方企业开发

Google 用 AI 魔法重塑《绿野仙踪》，打造全沉浸式 3D 体验

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

AI 遇见大型机：IBM Z17 大胆押注内幕

Starburst CEO: AI 领域的胜者在于数据访问能力

这家初创公司刚获得1.15亿美元融资，让工程设计速度提升1000倍 — 贝佐斯、奥特曼和英伟达都在押注其成功

ChatGPT 危险：5 件你绝不应该告诉 AI 机器人的事情

斯坦福的 AI 指数：重塑企业科技战略的 5 个关键洞察

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: