人工智能初创公司 Cohere Inc. 今日发布了其最新的大语言模型 Command A,该模型能够以最少的硬件需求满足企业的高性能需求,相比竞争对手的 AI 模型具有明显优势。
这家初创公司宣称,该大语言模型的性能超过了领先的专有和开源模型,如 OpenAI GPT-4o 和 DeepSeek-V3。公司还表示,在私有部署环境中,该模型只需要两块 Nvidia 的 A100 或 H100 GPU 就能运行,而竞争对手的模型可能需要多达 32 块。
这种规模差异非常重要,因为金融和医疗保健等需要内部部署的客户,通常必须将其 AI 模型部署在防火墙内。这意味着他们需要购买昂贵的 AI 加速硬件,并且必须拥有能在企业内部环境中运行的高性能模型。
Cohere 表示:"在商业、STEM 和编程任务的人工评估对比中,Command A 与其体量更大、速度更慢的竞争对手相比,表现相当或更优——同时提供更高的吞吐量和更好的效率。"具体而言,Command A 的 token 生成速率可达到 156 tokens/秒,比 GPT-4o 快 1.75 倍,比 DeepSeek-V3 快 2.4 倍。
考虑到商业用途,该模型还具有更大的上下文窗口,达到 256,000 tokens,是行业平均水平的两倍,包括 Cohere 自己的 Command R+ 模型。这意味着该模型可以一次性处理大量文档或长达 600 页的书籍。
Cohere 联合创始人 Nick Frosst 表示:"我们只训练模型来帮助你更好地完成工作。这应该感觉像是为你的思维装上了机甲。因此,我们训练它是为了赋能于你。它应该在这方面表现得特别出色。"
该公司表示,他们专注于开发能够实现 AI 代理可扩展运营的模型功能。代理式 AI 最近已成为行业的重要趋势,旨在创建能够分析数据、做出决策并执行任务的人工智能系统,而无需或仅需最少的人工参与。在实践中,这需要大量的计算能力,要基于公司信息高效准确地完成这些任务需要训练有素的 AI 模型。
Cohere 表示,Command A 将直接集成到其安全的 AI 代理平台 North 中,该平台允许企业用户充分利用其公司数据的潜力。该平台旨在使企业 AI 代理能够使用客户关系管理、资源规划软件等工具来自动化任务。
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。