DeepSeek 在一月份推出的 R-1 AI 模型显然打乱了 AI 市场的秩序。美国科技股市值蒸发超过 1 万亿美元,OpenAI、Alphabet 和 Meta 等前沿模型开发商都被这家中国初创公司打了个措手不及。DeepSeek 声称其推理模型性能可与 OpenAI 的 o1 产品相媲美,运行速度提高一倍,但成本仅为后者的 10%。
尽管该模型的开发存在争议,但 DeepSeek 大大加速了 AI 模型的商品化进程。这是个好消息,将推动创新,特别是对企业软件开发商而言。对于 CIO 来说,这意味着有更多供应商的 AI 产品可供考虑和评估,同时也降低了企业内部构建 AI 能力的门槛。
更便宜、更好、更快
过去 50 年的数字创新史就是系统越来越强大而成本越来越低的历史。摩尔定律在这段时期一直适用于微处理器,类似的模式也可以在计算革命的其他核心要素中观察到。在过去十年中,AI 似乎也遵循这一趋势,自 2022 年 ChatGPT 推出以来,发展速度更是急剧加快。据科技企业家和 AI 专家 Azeem Azhar 称,OpenAI 于 2023 年 3 月推出的 GPT-4 运行成本为每百万 token 36 美元,而 DeepSeek 以 0.14 美元就能提供类似性能——便宜 250 倍。
开源 AI 模型的激增——目前 Hugging Face 平台上列出了超过 100 万个模型——正在推动创新,特别是在应用端。DeepSeek 只是将这一趋势提升了一个数量级。我们可以预期,今年的关注重点将从模型开发者转移到那些利用这种低成本环境进行创新的商业应用开发者身上。
与微软的 PC 操作系统、谷歌搜索和 Meta 的社交媒体不同,看起来在短期内不会有任何单一模型开发者能够主导 AI 的发展方向。IDPartner Systems 联合创始人兼 CEO Rod Boothby 认为,OpenAI 作为目前主导的模型开发者,仅提供单元创新,而微软、Meta 和谷歌则具有利用网络效应使所有系统用户受益的系统创新。软件开发者和用户从稳定且广泛使用的 PC 操作系统中受益;网站运营者可以针对主导搜索引擎优化他们的网站;谷歌、Instagram 和 Facebook 用户可以连接并关注数百万其他用户。Boothby 表示:"除非 OpenAI 创建一个人们可以互动和获利的平台,否则它可能仍然只是众多可轻易替代的模型供应商之一。"
为企业构建
随着模型成本下降,AI 的价值向应用层迁移,企业将在业务解决方案方面有更多选择,无论是来自第三方还是内部开发。对于能够获得适当资源的 CIO 来说,内部开发应用现在是一个更现实的选择。在企业特有的复杂业务流程背景下,这变得越来越具有吸引力。随着运行模型的成本降至接近零,投资回报率的计算发生了巨大变化。根据 Forrester Research 的研究,在 PC 上本地运行像 DeepSeek 这样的超高效模型的能力开启了边缘智能的新时代,企业可以在整个组织中部署这种能力。
数字转型专家 Keystone 的 CoreAI 总裁 Devesh Mishra 表示:"AI 的真正价值不仅在于构建更大的模型,还在于在其基础上创新并高效实施。将基础模型的进步与深厚的业务和运营专业知识相结合的公司将引领下一阶段的 AI 驱动的投资回报。"
对行业垂直领域及其特定问题和需求的深入理解将定义许多供应商的成功,因为他们将越来越多地与内部开发团队竞争。AI 改变许多业务流程的潜力使许多现成的解决方案变得无关紧要。
根据 Azhar 的观点,这对 AI 代理来说尤其如此,他认为当像 DeepSeek 这样的系统每秒可以处理 250 个 token 时,实时 AI 就成为了现实可能。在这种环境下,AI 代理之间的通信速度可以比人类快 50 到 100 倍。巨大的效率和成本节省潜力将给 CIO 带来更大的压力和风险,要求他们在所有业务功能中以及与供应商和客户的合作中评估这项技术。Gartner 的 AI 路线图是一个有用的起点,因为它将技术、人力、数据和战略因素结合在一起,帮助领导者开始这个过程。
十多年前,风险投资公司 Andreessen Horowitz 的合伙人、Netscape 联合创始人 Marc Andreessen 在数字转型的背景下说软件正在吞噬世界。现在许多业务流程和交易都由软件处理(通常在后台进行)这一事实支持了他的假设。然而,进展比许多人预测的要慢,包括 Andreessen 在内。过去几年 AI 在不同形式下的崛起,加上 DeepSeek 的 R-1 模型的戏剧性发布,预示着这一旅程将发生重大转变。
好文章,需要你的鼓励
这项研究提出了R1-Searcher++框架,通过两阶段训练策略使大语言模型能像人类一样灵活利用内部知识和外部信息。该方法创新性地采用强化学习激励模型优先使用内部知识,并引入记忆机制将检索到的信息转化为内部知识,实现动态知识获取。实验表明,R1-Searcher++不仅在多步问答任务上表现优异,还大幅减少了检索次数,显著提高了推理效率。
这项研究提出了AutoRefine,一种革新性的强化学习框架,为大语言模型引入了"边思考边搜索和完善"的全新范式。与传统方法不同,AutoRefine在连续搜索调用之间添加知识完善步骤,让模型能够有效过滤和组织信息。通过结合答案正确性和检索质量双重奖励,该方法在七项问答基准测试中平均提升6.9%的准确率,特别在复杂多跳推理场景中表现突出,解决了现有检索增强推理的核心局限性。
这项研究揭示了一种新型网络安全威胁:利用普通网络广告攻击AI网页代理。中科院研究团队开发的AdInject攻击无需特殊权限,仅通过精心设计的广告内容就能误导AI代理点击恶意链接,成功率高达90%以上。研究使用严格的黑盒模型,更符合现实场景,暴露了当前AI代理面临的实际安全漏洞。实验还表明,即使添加专门的防御提示,这类攻击仍能成功率超过50%,凸显了设计更强大防御机制的紧迫性。
东北大学与快手科技联合研发的UNITE系统为多模态信息检索带来突破性进展。这项发表于2025年5月的研究首次系统分析了模态特定数据如何影响检索性能,并提出创新的模态感知掩码对比学习技术,有效解决不同模态间的竞争关系。UNITE能同时处理文本、图像、视频及其组合,在40多项测试中超越现有方法,即使与参数规模更大的模型相比也表现出色。研究发现视频-文本对在通用检索中表现优异,而文本-文本和文本-图像对对指令遵循任务至关重要,为未来多模态系统研究提供了宝贵指南。