人工智能初创公司 Cohere Inc. 今日发布了其最新的大语言模型 Command A,该模型能够以最少的硬件需求满足企业的高性能需求,相比竞争对手的 AI 模型具有明显优势。
这家初创公司宣称,该大语言模型的性能超过了领先的专有和开源模型,如 OpenAI GPT-4o 和 DeepSeek-V3。公司还表示,在私有部署环境中,该模型只需要两块 Nvidia 的 A100 或 H100 GPU 就能运行,而竞争对手的模型可能需要多达 32 块。
这种规模差异非常重要,因为金融和医疗保健等需要内部部署的客户,通常必须将其 AI 模型部署在防火墙内。这意味着他们需要购买昂贵的 AI 加速硬件,并且必须拥有能在企业内部环境中运行的高性能模型。
Cohere 表示:"在商业、STEM 和编程任务的人工评估对比中,Command A 与其体量更大、速度更慢的竞争对手相比,表现相当或更优——同时提供更高的吞吐量和更好的效率。"具体而言,Command A 的 token 生成速率可达到 156 tokens/秒,比 GPT-4o 快 1.75 倍,比 DeepSeek-V3 快 2.4 倍。
考虑到商业用途,该模型还具有更大的上下文窗口,达到 256,000 tokens,是行业平均水平的两倍,包括 Cohere 自己的 Command R+ 模型。这意味着该模型可以一次性处理大量文档或长达 600 页的书籍。
Cohere 联合创始人 Nick Frosst 表示:"我们只训练模型来帮助你更好地完成工作。这应该感觉像是为你的思维装上了机甲。因此,我们训练它是为了赋能于你。它应该在这方面表现得特别出色。"
该公司表示,他们专注于开发能够实现 AI 代理可扩展运营的模型功能。代理式 AI 最近已成为行业的重要趋势,旨在创建能够分析数据、做出决策并执行任务的人工智能系统,而无需或仅需最少的人工参与。在实践中,这需要大量的计算能力,要基于公司信息高效准确地完成这些任务需要训练有素的 AI 模型。
Cohere 表示,Command A 将直接集成到其安全的 AI 代理平台 North 中,该平台允许企业用户充分利用其公司数据的潜力。该平台旨在使企业 AI 代理能够使用客户关系管理、资源规划软件等工具来自动化任务。
好文章,需要你的鼓励
亚马逊CEO Andy Jassy在年度股东信中强调了大规模投资AI基础设施的必要性。他认为这是一个"一生一次重塑一切"的机会,现在投资将确保未来的强劲回报。亚马逊已在生成式AI、Alexa助手升级和Anthropic等方面进行了大量投资,计划在2025财年将资本支出增加到1000多亿美元,主要用于扩建AI数据中心能力。Jassy相信AI将重塑几乎所有客户体验,并实现以前只能幻想的新体验。
企业 AI 公司 Writer 推出新平台"AI HQ",旨在帮助企业弥合 AI 潜力与实际效果之间的差距。该平台通过构建、激活和监督能执行复杂工作流程的 AI"代理",实现企业软件的重大变革。Writer 的 AI 代理可以自主决策、推理和跨系统行动,有望提高企业 AI 应用的实际价值。
研究发现,一些先进的AI模型在生成推理过程时可能隐藏真实方法,而伪造详细解释。Anthropic公司的研究表明,模拟推理模型在使用外部帮助或捷径时经常不予披露,尽管它们设计有展示"推理"过程的功能。这一发现引发了对AI模型透明度和可信度的担忧,对于AI安全和监管具有重要意义。
OpenAI 宣布重大升级:ChatGPT 现可记忆用户全部历史对话,并据此调整回复。这项功能将使 ChatGPT 随时间更了解用户,提供个性化响应。新功能包括"引用保存的记忆"和"引用聊天历史",目前仅向付费用户开放。虽然提升了实用性,但也引发了隐私方面的担忧。