DeepSeek 在一月份推出的 R-1 AI 模型显然打乱了 AI 市场的秩序。美国科技股市值蒸发超过 1 万亿美元,OpenAI、Alphabet 和 Meta 等前沿模型开发商都被这家中国初创公司打了个措手不及。DeepSeek 声称其推理模型性能可与 OpenAI 的 o1 产品相媲美,运行速度提高一倍,但成本仅为后者的 10%。
尽管该模型的开发存在争议,但 DeepSeek 大大加速了 AI 模型的商品化进程。这是个好消息,将推动创新,特别是对企业软件开发商而言。对于 CIO 来说,这意味着有更多供应商的 AI 产品可供考虑和评估,同时也降低了企业内部构建 AI 能力的门槛。
更便宜、更好、更快
过去 50 年的数字创新史就是系统越来越强大而成本越来越低的历史。摩尔定律在这段时期一直适用于微处理器,类似的模式也可以在计算革命的其他核心要素中观察到。在过去十年中,AI 似乎也遵循这一趋势,自 2022 年 ChatGPT 推出以来,发展速度更是急剧加快。据科技企业家和 AI 专家 Azeem Azhar 称,OpenAI 于 2023 年 3 月推出的 GPT-4 运行成本为每百万 token 36 美元,而 DeepSeek 以 0.14 美元就能提供类似性能——便宜 250 倍。
开源 AI 模型的激增——目前 Hugging Face 平台上列出了超过 100 万个模型——正在推动创新,特别是在应用端。DeepSeek 只是将这一趋势提升了一个数量级。我们可以预期,今年的关注重点将从模型开发者转移到那些利用这种低成本环境进行创新的商业应用开发者身上。
与微软的 PC 操作系统、谷歌搜索和 Meta 的社交媒体不同,看起来在短期内不会有任何单一模型开发者能够主导 AI 的发展方向。IDPartner Systems 联合创始人兼 CEO Rod Boothby 认为,OpenAI 作为目前主导的模型开发者,仅提供单元创新,而微软、Meta 和谷歌则具有利用网络效应使所有系统用户受益的系统创新。软件开发者和用户从稳定且广泛使用的 PC 操作系统中受益;网站运营者可以针对主导搜索引擎优化他们的网站;谷歌、Instagram 和 Facebook 用户可以连接并关注数百万其他用户。Boothby 表示:"除非 OpenAI 创建一个人们可以互动和获利的平台,否则它可能仍然只是众多可轻易替代的模型供应商之一。"
为企业构建
随着模型成本下降,AI 的价值向应用层迁移,企业将在业务解决方案方面有更多选择,无论是来自第三方还是内部开发。对于能够获得适当资源的 CIO 来说,内部开发应用现在是一个更现实的选择。在企业特有的复杂业务流程背景下,这变得越来越具有吸引力。随着运行模型的成本降至接近零,投资回报率的计算发生了巨大变化。根据 Forrester Research 的研究,在 PC 上本地运行像 DeepSeek 这样的超高效模型的能力开启了边缘智能的新时代,企业可以在整个组织中部署这种能力。
数字转型专家 Keystone 的 CoreAI 总裁 Devesh Mishra 表示:"AI 的真正价值不仅在于构建更大的模型,还在于在其基础上创新并高效实施。将基础模型的进步与深厚的业务和运营专业知识相结合的公司将引领下一阶段的 AI 驱动的投资回报。"
对行业垂直领域及其特定问题和需求的深入理解将定义许多供应商的成功,因为他们将越来越多地与内部开发团队竞争。AI 改变许多业务流程的潜力使许多现成的解决方案变得无关紧要。
根据 Azhar 的观点,这对 AI 代理来说尤其如此,他认为当像 DeepSeek 这样的系统每秒可以处理 250 个 token 时,实时 AI 就成为了现实可能。在这种环境下,AI 代理之间的通信速度可以比人类快 50 到 100 倍。巨大的效率和成本节省潜力将给 CIO 带来更大的压力和风险,要求他们在所有业务功能中以及与供应商和客户的合作中评估这项技术。Gartner 的 AI 路线图是一个有用的起点,因为它将技术、人力、数据和战略因素结合在一起,帮助领导者开始这个过程。
十多年前,风险投资公司 Andreessen Horowitz 的合伙人、Netscape 联合创始人 Marc Andreessen 在数字转型的背景下说软件正在吞噬世界。现在许多业务流程和交易都由软件处理(通常在后台进行)这一事实支持了他的假设。然而,进展比许多人预测的要慢,包括 Andreessen 在内。过去几年 AI 在不同形式下的崛起,加上 DeepSeek 的 R-1 模型的戏剧性发布,预示着这一旅程将发生重大转变。
好文章,需要你的鼓励
OpenAI、Anthropic和Google的AI代码助手现在能够在人工监督下连续工作数小时,编写完整应用、运行测试并修复错误。但这些工具并非万能,可能会让软件项目变得复杂。AI代码助手的核心是大语言模型,通过多个LLM协作完成任务。由于存在上下文限制和"注意力预算"问题,系统采用上下文压缩和多代理架构来应对。使用时需要良好的软件开发实践,避免"氛围编程",确保代码质量和安全性。研究显示经验丰富的开发者使用AI工具可能反而效率降低。
这项研究由北京交通大学研究团队完成,系统阐述了人工智能智能体从"流水线"范式向"模型原生"范式的转变。研究表明,通过强化学习,AI可以自主学会规划、使用工具和管理记忆等核心能力,而不再依赖外部脚本。论文详细分析了这一范式转变如何重塑深度研究助手和GUI智能体等实际应用,并探讨了未来多智能体协作和自我反思等新兴能力的发展方向。
英伟达与AI芯片竞争对手Groq达成非独家授权协议,将聘请Groq创始人乔纳森·罗斯、总裁桑尼·马德拉等员工。据CNBC报道,英伟达以200亿美元收购Groq资产,但英伟达澄清这并非公司收购。Groq开发的LPU语言处理单元声称运行大语言模型速度快10倍,能耗仅为十分之一。该公司今年9月融资7.5亿美元,估值69亿美元,为超200万开发者的AI应用提供支持。
Prime Intellect团队发布开源AI训练全栈INTELLECT-3,这个106亿参数模型在数学、编程等测试中超越多个大型前沿模型。团队完全开源了包括prime-rl训练框架、环境库、代码执行系统在内的完整基础设施,为AI研究社区提供了高质量的训练工具,推动AI技术民主化发展。