据多家媒体报道,OpenAI 的竞争对手 Anthropic PBC 正寻求筹集高达 20 亿美元的新资金。
CNBC 和华尔街日报援引消息人士的话称,这轮投资可能使公司估值达到 600 亿美元。这比 Anthropic 去年在由 Menlo Ventures 领投的融资轮中获得的估值高出三倍多。据称,Lightspeed Venture Partners 正在领投公司的这轮最新融资。
Anthropic 开发了一系列名为 Claude 的大语言模型。今年 6 月,该公司发布了该系列中最先进的模型 Claude 3.5 Sonnet。两个月后,公司推出了该大语言模型的升级版,可以代表用户在应用程序中执行操作。
最新发布的 Claude 3.5 Sonnet 在衡量神经网络编程技能的基准测试 SWE-bench Verified 上得分为 49%。这比 6 月首次亮相的原始版本提高了近 16%。Claude 3.5 Sonnet 与功能较弱但更具成本效益的 Claude 3.5 Haiku 一起提供,后者在 SWE-bench Verified 上的得分为 40.6%。
Anthropic 通过应用程序接口提供其大语言模型。该公司还提供了一个名为 Claude Enterprise 的类似 ChatGPT 的聊天机器人。该服务可以根据用户提供的数据集生成代码、创建销售预测并执行其他业务任务。
CNBC 援引消息人士的话称,Anthropic 目前的年化经常性收入为 8.75 亿美元,主要来自与企业的交易。去年 9 月,路透社报道称,OpenAI 有望在 2024 年实现 37 亿美元的收入,并预计今年将达到 116 亿美元。CNBC 的消息人士没有具体说明 Anthropic 的增长速度。
在发布最新版本的 Claude 3.5 Sonnet 时,Anthropic 透露了未来推出更强大模型 Claude 3.5 Opus 的计划。它正在筹集的新资金可能有助于支持这一开发工作。
OpenAI 最新的推理模型基于一种称为测试时计算的机器学习方法。它通过增加处理提示所使用的硬件数量来提高大语言模型的响应质量,这反过来又会提高推理成本。如果 Anthropic 决定在未来的大语言模型中实施测试时计算,它正在筹集的 20 亿美元可能会使其更容易承担相关成本。
据报道的这轮融资是继三轮数十亿美元投资之后的又一次融资。
2023 年,Anthropic 获得了来自 Google LLC 高达 20 亿美元的投资。同年晚些时候,亚马逊以 40 亿美元的价格收购了这家大语言模型开发商的股份。去年 11 月,作为协议的一部分,AWS 将其投资翻倍,同时成为 Anthropic 的主要 AI 训练基础设施合作伙伴。
OpenAI 去年以 1570 亿美元的估值完成了 66 亿美元的融资。它还从一群银行获得了 40 亿美元的信贷额度。另一家通用大语言模型领域的主要参与者 Cohere Inc. 此前从 Advanced Micro Devices Inc. 和其他投资者那里筹集了 5 亿美元。
好文章,需要你的鼓励
卢森堡大学研究团队开发的RLDP框架首次将强化学习应用于差分隐私优化,创造性地解决了AI训练中隐私保护与模型效果的矛盾。该方法如同智能教练,能动态调整隐私保护策略,在四种语言模型上实现平均5.6%的性能提升和71%的训练时间缩短,同时增强了抗隐私攻击能力,为敏感数据的AI应用开辟了新路径。
这项由北京大学人工智能研究院完成的研究,首次从数据压缩理论角度揭示了大型语言模型存在"弹性"现象——即使经过精心安全对齐,模型仍倾向于保持预训练时的行为分布。
腾讯混元团队联合北京大学提出MixGRPO技术,通过混合ODE-SDE采样策略和滑动窗口机制,将AI图像生成训练效率提升50%-71%,同时在多项人类偏好评估指标上超越现有方法。该技术采用"从难到易"的渐进优化策略,专注于图像生成早期阶段的重点优化,并引入高阶求解器进一步加速训练过程,为AI图像生成的产业化应用提供了更高效可行的解决方案。