热门Python库存在元数据投毒攻击漏洞

Hugging Face模型中使用的热门AI和机器学习Python库存在漏洞，允许远程攻击者在元数据中隐藏恶意代码。这些开源库包括英伟达的NeMo、Salesforce的Uni2TS和苹果与瑞士联邦理工学院合作开发的FlexTok。漏洞涉及Meta维护的Hydra库的instantiate()函数。当加载包含恶意元数据的文件时，恶意代码会自动执行。虽然目前尚未发现野外利用案例，但攻击面广泛，存在被滥用的风险。

Hugging Face模型中使用的热门AI和机器学习Python库存在漏洞，这些库的下载量达到数千万次。该漏洞允许远程攻击者在元数据中隐藏恶意代码，当加载包含被投毒元数据的文件时，恶意代码会自动执行。

受影响的开源库包括NeMo、Uni2TS和FlexTok，分别由英伟达、Salesforce以及苹果与瑞士联邦理工学院视觉智能与学习实验室(EPFL VILAB)联合开发。

这三个库都使用了Hydra，这是Meta维护的另一个Python库，通常用作机器学习项目的配置管理工具。具体来说，漏洞涉及Hydra的instantiate()函数。

Palo Alto Networks的Unit 42团队发现了这些安全漏洞并报告给库的维护者，维护者随后发布了安全警告、修复补丁，其中两个案例还分配了CVE编号。虽然威胁猎人表示目前尚未发现这些漏洞被实际利用，但"攻击者有充分的机会利用它们"。

Unit 42恶意软件研究工程师Curtis Carmony在周二的分析中写道："开发者通常会创建自己的最先进模型变体，采用不同的微调和量化方法，通常来自与知名机构无关的研究人员。攻击者只需要创建现有热门模型的修改版本，声称具有真实或虚假的优势，然后添加恶意元数据。"

此外，Hugging Face不像处理其他文件那样容易访问元数据内容，也不会将使用safetensors或NeMo文件格式的文件标记为潜在不安全。

Hugging Face上的模型使用超过100种不同的Python库，其中近50种使用Hydra。Carmony写道："虽然这些格式本身可能是安全的，但处理它们的代码存在非常大的攻击面。"

Hydra漏洞分析

如前所述，这些漏洞与NeMo、Uni2TS和FlexTok使用hydra.utils.instantiate()函数从模型元数据加载配置的方式有关，这允许远程代码执行(RCE)。

这些库的创建者或维护者似乎忽略了instantiate()函数不仅接受要实例化的类名，还接受任何可调用对象的名称并向其传递提供的参数这一事实。

通过利用这一点，攻击者可以使用内置Python函数(如eval()和os.system())更容易地实现RCE。

Meta已更新Hydra文档，警告使用instantiate()时可能发生RCE，并敦促用户添加阻止列表机制，在调用前将_target_值与危险函数列表进行比较。但是，阻止列表机制尚未在Hydra发布版本中提供。

NeMo库漏洞

NeMo是英伟达于2019年创建的基于PyTorch的框架。其.nemo和.qnemo文件扩展名是包含model_config.yaml文件的TAR文件，分别存储模型元数据以及.pt文件或.safetensors文件。

问题在于，在NeMo文件调用hydra.utils.instantiate() API之前，元数据没有经过清理，这允许攻击者加载具有恶意制作元数据的.nemo文件，触发漏洞并实现RCE或篡改数据。

英伟达发布了CVE-2025-23304来跟踪这个高严重性错误，并在NeMo 2.3.2版本中发布了修复。

NeMo还与Hugging Face集成，攻击者可以在模型下载后通过相同的代码路径利用此漏洞。

根据Unit 42的数据，Hugging Face上有超过700个来自各种开发者的模型采用NeMo文件格式。

Uni2TS库漏洞

Uni2TS是Salesforce创建的PyTorch库，用于其时间序列分析的Morai基础模型以及在Hugging Face上发布的一系列模型。

该库专门使用.safetensors文件，这是Hugging Face创建的用于存储张量的安全格式，与pickle相对，pickle在加载过程中允许任意代码执行。

使用这些库的Salesforce模型在Hugging Face上有数十万次下载，其他用户也发布了这些模型的多个改编版本。

Salesforce于7月31日发布了CVE-2026-22584并部署了修复。

FlexTok库漏洞

去年早些时候，苹果和EPFL VILAB创建了FlexTok，这是一个基于Python的框架，使AI/机器学习模型能够处理图像。

与uni2TS一样，FlexTok仅使用safetensors文件，它扩展了PyTorchModelHubMixin，可以从.safetensors文件加载配置和元数据。解码元数据后，FlexTok将其传递给hydra.utils.instantiate()，这会触发漏洞。

截至2026年1月，除了EPFL VILAB发布的模型外，Hugging Face上似乎没有其他模型使用ml-flextok库，这些模型总计有数万次下载。

苹果和EPFL VILAB通过使用YAML解析配置修复了这些安全问题。维护者还添加了可以调用Hydra的instantiate()函数的类的允许列表，并更新文档以说明应该只加载来自可信来源的模型。

Q&A

Q1：这次发现的Python库漏洞具体是什么问题？

A：漏洞存在于NeMo、Uni2TS和FlexTok这三个热门AI库中，它们都使用Hydra库的instantiate()函数。问题在于该函数不仅接受类名，还接受任何可调用对象，攻击者可以利用这一点在模型元数据中隐藏恶意代码，当文件被加载时代码会自动执行。

Q2：Hugging Face平台上有多少模型受到影响？

A：根据Unit 42的统计，Hugging Face上超过700个模型使用NeMo文件格式，使用Salesforce相关库的模型有数十万次下载，FlexTok相关模型有数万次下载。平台上使用的超过100种Python库中，近50种使用了存在漏洞的Hydra库。

Q3：这些漏洞现在修复了吗？

A：是的，相关厂商已经发布了修复。英伟达在NeMo 2.3.2版本中修复并发布了CVE-2025-23304，Salesforce在7月31日发布了CVE-2026-22584修复，苹果和EPFL VILAB通过使用YAML解析和添加允许列表机制修复了FlexTok的问题。

来源：The Register

0赞

好文章，需要你的鼓励

热门Python库存在元数据投毒攻击漏洞

来源：The Register

2026

01/15

14:40

分享

点赞

NHS单一患者电子档案或每年减少两万次急诊就诊并节省两千万英镑【正常】

苹果智能眼镜据报道推迟至2027年底发布

2026年第一季度Mac恶意软件威胁态势全面回顾【正常】

AI的冷漠与空洞：它的乏味之声为何契合当下政治氛围【正常】

苹果新版Apple TV与HomePod mini将于今秋发布，Siri遥控器或迎来更新

从被动响应到自主运营：IT领导者下一步该怎么做【正常】

苹果AI智能眼镜延迟至2027年底发布，Vision Air最早2029年亮相

真正改善日常生活的家居AI功能盘点

"心灵子嗣"会是人类繁殖的未来吗？

水资源成为AI数据中心扩张的新瓶颈【正常】

CoreWeave推出AI智能体自主优化能力，企业部署效率大幅提升

英国智库呼吁：赋予员工更多AI决策权，确保技术红利公平共享

SK海力士投资130亿美元建设封装厂，满足AI芯片HBM内存需求

微软Copilot AI助手曝重大安全漏洞 单击链接即可窃取用户隐私

OpenAI与Cerebras达成100亿美元算力合作协议

2026年最佳笔记本电脑：CNET测试推荐榜单

WitnessAI融资5800万美元解决企业AI最大风险

AI智能体正成为权限提升的隐患通道

Snowflake收购Observe增强AIops可观测性能力

机器人软件公司Skild AI估值飙升至140亿美元

Bandcamp成为首个全面禁止AI音乐内容的主流平台

Novee获得5150万美元融资，将AI攻击性安全测试引入企业市场

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

微软Copilot AI助手曝重大安全漏洞单击链接即可窃取用户隐私