DeepSeek 在一月份推出的 R-1 AI 模型显然打乱了 AI 市场的秩序。美国科技股市值蒸发超过 1 万亿美元,OpenAI、Alphabet 和 Meta 等前沿模型开发商都被这家中国初创公司打了个措手不及。DeepSeek 声称其推理模型性能可与 OpenAI 的 o1 产品相媲美,运行速度提高一倍,但成本仅为后者的 10%。
尽管该模型的开发存在争议,但 DeepSeek 大大加速了 AI 模型的商品化进程。这是个好消息,将推动创新,特别是对企业软件开发商而言。对于 CIO 来说,这意味着有更多供应商的 AI 产品可供考虑和评估,同时也降低了企业内部构建 AI 能力的门槛。
更便宜、更好、更快
过去 50 年的数字创新史就是系统越来越强大而成本越来越低的历史。摩尔定律在这段时期一直适用于微处理器,类似的模式也可以在计算革命的其他核心要素中观察到。在过去十年中,AI 似乎也遵循这一趋势,自 2022 年 ChatGPT 推出以来,发展速度更是急剧加快。据科技企业家和 AI 专家 Azeem Azhar 称,OpenAI 于 2023 年 3 月推出的 GPT-4 运行成本为每百万 token 36 美元,而 DeepSeek 以 0.14 美元就能提供类似性能——便宜 250 倍。
开源 AI 模型的激增——目前 Hugging Face 平台上列出了超过 100 万个模型——正在推动创新,特别是在应用端。DeepSeek 只是将这一趋势提升了一个数量级。我们可以预期,今年的关注重点将从模型开发者转移到那些利用这种低成本环境进行创新的商业应用开发者身上。
与微软的 PC 操作系统、谷歌搜索和 Meta 的社交媒体不同,看起来在短期内不会有任何单一模型开发者能够主导 AI 的发展方向。IDPartner Systems 联合创始人兼 CEO Rod Boothby 认为,OpenAI 作为目前主导的模型开发者,仅提供单元创新,而微软、Meta 和谷歌则具有利用网络效应使所有系统用户受益的系统创新。软件开发者和用户从稳定且广泛使用的 PC 操作系统中受益;网站运营者可以针对主导搜索引擎优化他们的网站;谷歌、Instagram 和 Facebook 用户可以连接并关注数百万其他用户。Boothby 表示:"除非 OpenAI 创建一个人们可以互动和获利的平台,否则它可能仍然只是众多可轻易替代的模型供应商之一。"
为企业构建
随着模型成本下降,AI 的价值向应用层迁移,企业将在业务解决方案方面有更多选择,无论是来自第三方还是内部开发。对于能够获得适当资源的 CIO 来说,内部开发应用现在是一个更现实的选择。在企业特有的复杂业务流程背景下,这变得越来越具有吸引力。随着运行模型的成本降至接近零,投资回报率的计算发生了巨大变化。根据 Forrester Research 的研究,在 PC 上本地运行像 DeepSeek 这样的超高效模型的能力开启了边缘智能的新时代,企业可以在整个组织中部署这种能力。
数字转型专家 Keystone 的 CoreAI 总裁 Devesh Mishra 表示:"AI 的真正价值不仅在于构建更大的模型,还在于在其基础上创新并高效实施。将基础模型的进步与深厚的业务和运营专业知识相结合的公司将引领下一阶段的 AI 驱动的投资回报。"
对行业垂直领域及其特定问题和需求的深入理解将定义许多供应商的成功,因为他们将越来越多地与内部开发团队竞争。AI 改变许多业务流程的潜力使许多现成的解决方案变得无关紧要。
根据 Azhar 的观点,这对 AI 代理来说尤其如此,他认为当像 DeepSeek 这样的系统每秒可以处理 250 个 token 时,实时 AI 就成为了现实可能。在这种环境下,AI 代理之间的通信速度可以比人类快 50 到 100 倍。巨大的效率和成本节省潜力将给 CIO 带来更大的压力和风险,要求他们在所有业务功能中以及与供应商和客户的合作中评估这项技术。Gartner 的 AI 路线图是一个有用的起点,因为它将技术、人力、数据和战略因素结合在一起,帮助领导者开始这个过程。
十多年前,风险投资公司 Andreessen Horowitz 的合伙人、Netscape 联合创始人 Marc Andreessen 在数字转型的背景下说软件正在吞噬世界。现在许多业务流程和交易都由软件处理(通常在后台进行)这一事实支持了他的假设。然而,进展比许多人预测的要慢,包括 Andreessen 在内。过去几年 AI 在不同形式下的崛起,加上 DeepSeek 的 R-1 模型的戏剧性发布,预示着这一旅程将发生重大转变。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。