Cohere 发布仅需两块 GPU 的低成本 AI 模型

Cohere 推出新型大语言模型 Command A，具有高性能且硬件需求低。该模型性能超越 GPT-4o 和 DeepSeek-V3，仅需两块 GPU 即可运行。它拥有更大的上下文窗口，处理速度更快，专为企业级 AI 代理设计，可与 Cohere 的安全 AI 代理平台 North 无缝集成，帮助企业用户充分发挥公司数据潜力。

人工智能初创公司 Cohere Inc. 今日发布了其最新的大语言模型 Command A，该模型能够以最少的硬件需求满足企业的高性能需求，相比竞争对手的 AI 模型具有明显优势。

这家初创公司宣称，该大语言模型的性能超过了领先的专有和开源模型，如 OpenAI GPT-4o 和 DeepSeek-V3。公司还表示，在私有部署环境中，该模型只需要两块 Nvidia 的 A100 或 H100 GPU 就能运行，而竞争对手的模型可能需要多达 32 块。

这种规模差异非常重要，因为金融和医疗保健等需要内部部署的客户，通常必须将其 AI 模型部署在防火墙内。这意味着他们需要购买昂贵的 AI 加速硬件，并且必须拥有能在企业内部环境中运行的高性能模型。

Cohere 表示："在商业、STEM 和编程任务的人工评估对比中，Command A 与其体量更大、速度更慢的竞争对手相比，表现相当或更优——同时提供更高的吞吐量和更好的效率。"具体而言，Command A 的 token 生成速率可达到 156 tokens/秒，比 GPT-4o 快 1.75 倍，比 DeepSeek-V3 快 2.4 倍。

考虑到商业用途，该模型还具有更大的上下文窗口，达到 256,000 tokens，是行业平均水平的两倍，包括 Cohere 自己的 Command R+ 模型。这意味着该模型可以一次性处理大量文档或长达 600 页的书籍。

Cohere 联合创始人 Nick Frosst 表示："我们只训练模型来帮助你更好地完成工作。这应该感觉像是为你的思维装上了机甲。因此，我们训练它是为了赋能于你。它应该在这方面表现得特别出色。"

该公司表示，他们专注于开发能够实现 AI 代理可扩展运营的模型功能。代理式 AI 最近已成为行业的重要趋势，旨在创建能够分析数据、做出决策并执行任务的人工智能系统，而无需或仅需最少的人工参与。在实践中，这需要大量的计算能力，要基于公司信息高效准确地完成这些任务需要训练有素的 AI 模型。

Cohere 表示，Command A 将直接集成到其安全的 AI 代理平台 North 中，该平台允许企业用户充分利用其公司数据的潜力。该平台旨在使企业 AI 代理能够使用客户关系管理、资源规划软件等工具来自动化任务。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

Cohere 发布仅需两块 GPU 的低成本 AI 模型

来源：SiliconANGLE

2025

03/14

13:38

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

AI 时代的数据中心：未来十年规划展望

AI 编程助手拒绝写代码，建议用户自学编程

超越 ChatGPT：通往通用人工智能的 5 大挑战

Oracle 在 AI 主流化方面具有重大优势

Snap 推出基于自研生成模型的 AI 视频滤镜

Google 的 Gemma 3：一款支持 128K 上下文窗口的开源单 GPU AI 模型

精灵宝可梦 GO 迎来新东家，而 Niantic 正借助 AI 和 AR 重塑地图业务

Google 的 Gemini 2.0 Flash 原生多模态 AI 图像生成功能给人留下深刻印象

Google 推出两款全新 AI 机器人控制模型

Nvidia 赢得了 AI 训练竞赛，但推理市场仍未尘埃落定

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会