2025年,人工智能成为焦点,但还有许多其他发展和担忧值得关注。
2025年最重要的开源技术故事集中在四个方面:人工智能、许可证/治理、安全性以及"商业开源"业务模式的转变。
人工智能生态系统的开源基础
虽然大部分资金投向了专有模型,但开源AI数据集、编排框架、评估工具和防护栈都取得了显著进展。
Common Corpus等开源AI项目,连同Linux基金会AI与数据组托管的数十个AI项目,正在让我们能够使用社区基础设施进行生成式 AI开发,而不仅仅依赖专有API,使开源AI栈成为企业和用户的重要选择。
尽管开源AI定义仍存争议,很少有AI项目完全符合开源促进会(OSI)AI定义的严格要求,但AI仍建立在开源软件的基础之上。关于开放权重、数据和训练代码的辩论将持续下去,但即使是最专有的大语言模型也无法脱离开源程序而存在。
智能体AI完全依赖于开源。为了编排最新一代的AI智能体,我们使用了几个程序。
在这个早期阶段,最重要的似乎是模型上下文协议(MCP)。这是一个开放标准和开源实现,用于统一连接智能体与工具、文件、数据库和其他系统。
MCP正日益成为许多智能体和IDE助手的"管道层",有众多开源MCP服务器和工具包,让任何兼容的智能体框架都能接入相同的工具。
MCP并非唯一加速发展的智能体AI中间件:
6月,谷歌将其Agent2Agent协议捐赠给Linux基金会,该协议标准化了智能体之间的通信方式。微软智能体框架,一个专为构建、部署和管理多智能体、MCP感知应用程序设计的开源SDK和运行时,也越来越受欢迎。
商业开源的成功与挑战
Linux基金会8月发布的报告显示,风险投资支持的商业开源公司在过去25年中表现优于同类闭源供应商。
该报告与OSI在4月发布的开源采用数据调查一起,显示96%的组织正在维持或增加开源软件使用,巩固了商业开源作为软件构建默认方式的地位。
这些报告推动了更多融资、更多并购,以及围绕关键开源项目的更多"开源核心+服务"策略。
当然,我们早就知道这一点。毕竟,2024年哈佛商学院的研究已经显示,96%的商业程序依赖开源,开源代码的总价值达到8.8万亿美元。但这仍然无法阻止那些错误地将开源作为软件开发模型与商业模型混淆的公司;它从来不是,也永远不会是。
因此,在2025年,我们看到更多公司从开源转向"伪开源"。例如,ScyllaDB团队在2024年12月宣布,将转向单一的"ScyllaDB Enterprise"流,采用源码可用许可证。
在库层面,出现了一些高调的例子,之前宽松的项目悄悄转向源码可用、商业使用付费条款,比如Fluent Assertions .NET测试库在今年1月从Apache-2.0转向专有源码可用许可证,按开发者收费。
还有DevOps程序Puppet。虽然Puppet的核心代码库仍在Apache 2.0开源许可证下,但其商业母公司Perforce改变了官方构建的分发和许可方式。
变化在于,Puppet/Perforce构建的新"强化"二进制文件和包现在从私有仓库发布。Puppet核心最终用户许可协议(EULA)提供限制25个节点的免费层,超出节点需要商业许可。实际上,这使Puppet成为源码可用程序,尽管代码技术上仍然开源。
Puppet案例的结果与我们在其他试图关闭曾经开源项目的尝试中看到的一样:不满的程序员分叉了项目。这个分叉被称为OpenVox。
这些分叉项目包括Elasticsearch及其分叉OpenSearch、Redis及其分叉Valkey,以及Terraform及其分叉OpenTofu,都取得了一定成功。所有四个分叉都获得了有意义的关注,但规模不同,"成功"的定义也不同。
OpenSearch似乎是最成功的。它报告了强劲增长,包括两位数的78%年同比下载增长,以及包括亚马逊云服务、Canonical、SAP和Uber等主要成员的名单。
Valkey也证明很受欢迎。最新版本Valkey 9据报告比Redis的最新版本快得多。特别是,Valkey用户报告在原始吞吐量方面始终领先于可比较的Redis版本,特别是在大型、内存密集型工作负载中,Valkey的多线程I/O和缓存预取功能发挥作用。
虽然OpenSearch和Valkey都超越了它们的父项目,但Terraform vs. OpenTofu是另一个故事。人们仍然认为OpenTofu和Terraform仅在许可证上有所不同。然而,在过去几个月中,情况发生了变化,OpenTofu在4月加入云原生计算基金会后,更多地走自己的路线。最新版本现在包括状态加密(Terraform社区多年来一直想要的功能)和早期变量评估。
最后,OpenVox继续将自己定位为"软分叉"。其负责人希望它与Puppet保持100%兼容,以便作为Puppet部署的替代品。然而,这似乎不再可能,正如OpenVox领导者Gene Liverman所写:"我们不能再保证我们的模块能与Puppet Core或Puppet Enterprise一起工作。"
从项目维护者的角度来看,Perforce正在破坏兼容性。不过,目前OpenVox本质上是一个健康的社区救生艇,而不是一个全面的Puppet替代品。
资金不足和维护危机
尽管我们都依赖开源这一简单事实,但太多项目仍然资金不足。其他项目,如NET 6,仍然受欢迎,但其维护者已经停止支持。用户该怎么办?
这不是一个新问题。早在2021年,Tidelift(一家安全公司,也在经济上支持开源维护者)发现46%的开源项目维护者完全没有报酬。几乎同样糟糕的是,即使是那些有报酬的维护者,仅有26%的人每年从工作中赚取超过1000美元。
情况没有改善。事实上,它们变得更糟。2024年,Tidelift的最新结果显示,现在60%的开源维护者没有报酬。
正如10个开源基金会在9月发布的公开信中指出的:"大多数这些[开源]系统在一个危险的脆弱前提下运行:它们通常以依赖善意的方式维护、运营和资助,而不是将责任与使用情况相匹配的机制。"
因此,根据公开信,"少数组织承担了大部分基础设施成本,而绝大多数大规模用户,包括产生需求和提取经济价值的商业实体,消费这些服务而不为其可持续性做出贡献。"
我一直在关注的一个具体例子是FFMpeg的资金严重不足,尽管通过互联网观看视频的每个人都在使用它,亚马逊、谷歌和Netflix等主要公司都依赖其代码。还有许多其他这样的项目。这种情况不能继续下去。
答案是公司必须——必须——开始经济上支持关键任务开源项目。与这些项目倒闭或遭受重大安全问题时它们将遭受的损害相比,这样做的成本是微不足道的。
供应链安全威胁激增
2024年,xz数据压缩库代码被故意感染恶意软件,险些在Fedora(红帽的社区Linux)中插入后门。如果成功,它可能最终会出现在红帽企业Linux(RHEL)及其克隆版本中。
这本可能导致迄今为止最严重的Linux安全灾难。我们躲过了一劫。
不幸的是,开源软件供应链安全正受到持续的大规模攻击,以npm和PyPI为重点的攻击活动正在升级。
2025年的几个高影响活动集中在破坏开源包生态系统,特别是npm。
11月,来自Wiz、Aikido和其他机构的研究人员详细描述了"Shai-Hulud 2.0"波特洛伊木马npm包,这些包从使用与主要软件即服务和云工具相关的流行库的环境中窃取开发者和CI/CD凭据。
作为该活动的一部分,数万个恶意仓库被创建。GitLab的漏洞研究团队还报告了一个单独的广泛npm供应链攻击,该攻击收集了GitHub、npm和主要云的凭据,并通过感染受害者拥有的其他包进行传播。
这些不是一次性事件。2025年的行业威胁报告描述了整体软件供应链攻击的激增,10月创下了新的月度记录,开源生态系统在目标中占据重要地位。
来自Palo Alto Networks的Unit 42和其他研究团队的分析指出,攻击者越来越喜欢破坏维护者账户和发布管道,而不是核心源代码仓库,因为这种路径可以大规模地悄悄毒害可信包。
ReversingLabs在3月发布的研究报告称,虽然观察到的开源恶意软件包有所减少,但风险已转向泄露的开发者机密和构建时暴露。
研究人员检查流行的npm、PyPI和RubyGems组件,继续发现硬编码凭据、弱应用程序强化,以及在企业中广泛使用的二进制文件中的暴露数据。这种错误在80年代我第一次在生产软件中遇到时就很愚蠢,今天更是不可原谅。
更糟糕的是,JFrog和Veracode等安全公司报告,爆炸性的依赖图、更快的发布周期和开源库的大量重用意味着单个恶意或易受攻击的包可以在几天内波及数千个下游应用程序。
这种密集的相互连接使得2025年npm重点攻击活动等攻击的爆炸半径明显大于许多早期开源事件,特别是当目标库出现在20%到30%的扫描云环境中时。
我们能做什么?我们必须更广泛地采用软件物料清单(SBOM)、软件工件供应链级别(SLSA)风格的证明,以及开源软件基金会生态系统的工具来跟踪开源组件的来源和完整性。
OpenSSF及其合作伙伴强调了Sigstore(用于无密钥签名)、Scorecard(用于自动项目风险评估)和开源项目安全基线等举措,旨在为维护者和消费者提供更清晰的安全期望。
每年,我都告诉人们必须更认真地对待安全。最近,随着开源供应链违规变得越来越常见,我一直在说你必须确保供应链中的代码既安全又由值得信赖的人编写。
展望未来,我只能加倍这些警告。现在我们在过去几年中已经有了严重的安全漏洞。你还记得:SolarWinds、JetBrains TeamCity和Apache Log4j应该都会迅速想到。尽管这些都很糟糕,但如果我们不更认真地对待开源供应链安全,更严重的安全灾难就在前方。
Q&A
Q1:模型上下文协议MCP是什么?它有什么作用?
A:模型上下文协议(MCP)是一个开放标准和开源实现,用于统一连接AI智能体与工具、文件、数据库和其他系统。它正日益成为许多智能体和IDE助手的"管道层",有众多开源MCP服务器和工具包,让任何兼容的智能体框架都能接入相同的工具。
Q2:为什么越来越多的开源项目转向"伪开源"模式?
A:主要原因是公司错误地将开源作为软件开发模型与商业模型混淆。2025年,我们看到ScyllaDB、Puppet、Fluent Assertions等项目转向源码可用许可证,采用商业使用付费条款,这实际上是为了解决盈利问题,但违背了开源的初衷。
Q3:开源软件供应链安全面临哪些主要威胁?
A:主要威胁包括恶意软件注入(如2024年xz事件)、npm和PyPI等包生态系统的大规模攻击活动、维护者账户被破解、硬编码凭据泄露等。2025年10月创下了软件供应链攻击的月度记录,单个恶意包可在几天内波及数千个下游应用程序。
好文章,需要你的鼓励
Helios Towers供应链总监Dawn McCarroll在采访中分享了公司的数字化转型经验。作为一家在非洲和中东地区运营近15000个移动通信塔站的公司,Helios正通过SAP S/4Hana系统升级、AI技术应用和精益六西格玛方法论来优化供应链管理。McCarroll特别强调了公司Impact 2030战略中的数字包容性目标,计划在未来五年内培训60%的合作伙伴员工掌握精益六西格玛原则,并利用大数据和AI技术实现端到端的供应链集成。
UNC北卡教堂山分校研究团队开发了Agent0-VL,一个能自我进化的视觉语言AI系统。该系统创新性地采用求解者-验证者双重架构,通过工具集成推理实现零外部监督的持续自我改进。在几何问题和科学分析任务上性能提升12.5%,甚至超越GPT-4o等商业模型。这项突破性研究为AI自主学习开辟了新路径。
威胁行为者在npm注册表上传8个恶意包,伪装成n8n工作流自动化平台的集成组件来窃取开发者OAuth凭据。其中一个名为"n8n-nodes-hfgjf-irtuinvcm-lasdqewriit"的包模仿Google Ads集成,诱导用户在看似合法的表单中关联广告账户,然后将凭据传输到攻击者控制的服务器。这种攻击利用了工作流自动化平台作为集中凭据库的特点,能够获取多个服务的OAuth令牌和API密钥。
香港科技大学团队开发的MedSAM-3突破了传统医学图像分析的局限,首次实现了基于自然语言概念的精准医学图像分割。该系统能够仅通过"肺部肿瘤"等简单文字描述就准确识别医学图像中的目标区域,配合智能代理框架可处理复杂临床指令并自动优化结果,在多种医学成像模态上表现出色,为医学AI向概念化智能发展开辟新路径。