GPU租赁服务商CoreWeave在周三继续其AI服务领域的扩张,推出了一个旨在让企业客户更容易获得强化学习技术的平台。
强化学习是机器学习的一种方法,模型通过试错来自我学习,对积极结果给予奖励,对消极结果进行惩罚。在过去一年中,这种方法作为微调语言模型的手段越来越受欢迎。例如,DeepSeek R1的"推理"能力就是通过强化学习实现的。
CoreWeave周三推出的无服务器强化学习平台建立在其最近收购的两家公司基础上:专门使用强化学习构建定制AI智能体的OpenPipe,以及提供GPU加速工作负载无服务器平台的Weights & Biases。
在这种情况下,无服务器架构很有意义,因为工作负载可以分布在可用的空闲或未充分利用的GPU上,消除资源闲置。此外,许多AI工作负载本质上是无状态的,这意味着它们不需要存储先前会话的信息就能工作。
根据CoreWeave的说法,这消除了客户手动配置虚拟机或裸机服务器来使用强化学习构建定制AI智能体的需要。相反,他们只需为微调过程中生成的Token付费。
如果CoreWeave的说法可信,这种方法比使用本地托管的英伟达H100快约1.4倍,成本降低约40%。
目前,CoreWeave通过Weights & Biases平台提供这项服务。然而,展望未来,这家新兴云服务商旨在将其AI服务业务扩展到新领域。
就在本周,该公司宣布收购Monolith AI,这家公司专门从事不同类型的AI。与生成式模型不同,Monolith使用AI来加速传统上属于高性能计算的物理和工程仿真。
CoreWeave进军AI服务业务是其更广泛努力的一部分,旨在实现客户群多样化。无论好坏,其客户群一直由大型超大规模云服务商、云提供商和模型构建者主导。当该公司今年早些时候申请上市时,在其IPO招股说明书中警告称,2024年收入的77%来自两个客户,没有任何其他单一客户贡献超过10%的收入。现在情况可能没那么严峻,谷歌和IBM都是其客户,但尽管如此,对于这家负债累累的公司来说,多样化仍然至关重要。
Q&A
Q1:CoreWeave的无服务器强化学习平台有什么优势?
A:该平台消除了客户手动配置虚拟机或裸机服务器的需要,用户只需为微调过程中生成的Token付费。工作负载可以分布在可用的空闲GPU上,避免资源浪费,比使用本地英伟达H100快约1.4倍,成本降低约40%。
Q2:强化学习在AI领域有什么应用?
A:强化学习是一种机器学习方法,模型通过试错自我学习,对积极结果奖励,对消极结果惩罚。目前主要用于微调语言模型,例如DeepSeek R1的推理能力就是通过强化学习实现的,在过去一年中越来越受欢迎。
Q3:CoreWeave为什么要推出AI服务业务?
A:CoreWeave希望实现客户群多样化。根据其IPO招股说明书,2024年收入的77%来自两个客户,过度依赖大型超大规模云服务商、云提供商和模型构建者。作为一家负债累累的公司,多样化对其发展至关重要。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。