Nvidia 推出面向智能代理 AI 的新型防护微服务

英伟达为其 NeMo Guardrails 软件工具新增了 AI 防护微服务，旨在提高企业代理型 AI 应用的准确性、安全性和控制力。这些微服务包括内容安全、话题控制和越狱检测，有助于解决 IT 领导者在采用代理型 AI 技术时的主要顾虑，为 AI 应用部署提供更好的治理和保障。

Nvidia 今天为其 Nvidia NeMo Guardrails 软件工具新增了用于 AI 防护的 Nvidia 推理微服务 (NIMs)。这些新的微服务旨在帮助企业提高智能代理 AI 应用的准确性、安全性和控制力，解决了 IT 领导者在采用该技术时的主要顾虑。

"目前已有十分之一的组织正在使用 AI 代理，超过 80% 的组织计划在未来三年内采用 AI 代理，" Nvidia 企业 AI 模型、软件和服务副总裁 Kari Briski 在周三的新闻发布会上表示。"这意味着你不仅要构建能准确完成任务的代理，还必须评估 AI 代理是否满足安全性、数据隐私和治理要求，这可能成为部署的主要障碍。"

Briski 解释说，除了信任、安全和合规性之外，成功部署 AI 代理还需要确保其性能。它们必须在保持快速响应的同时，维持与终端用户和其他 AI 代理交互时的准确性。为此，Nvidia 今天推出了三个新的 NeMo Guardrails NIMs，用于内容安全、话题控制和越狱检测。

内容安全 NIM 旨在防止 AI 产生偏见或有害输出，确保生成式 AI 的响应符合道德标准。它基于 Nvidia 的开源 Aegis 内容安全数据集进行训练，该数据集包含 35,000 个经人工标注的 AI 安全标记样本。Aegis 用于教导 AI 如何审核其他 AI 模型生成的潜在有害内容。

话题控制 NIM 使 AI 代理保持专注于已批准的话题，防止其偏离主题或涉及不当内容。例如，它可以防止 AI 代理讨论竞争对手的产品。

越狱检测 NIM 通过防止试图绕过智能代理 AI 安全防护的"越狱"行为，帮助在"对抗场景"中维护 AI 的完整性。它基于 Nvidia Garak 构建，这是一个开源的漏洞扫描工具包，使用 17,000 个已知越狱案例进行训练。

通过防护实现更好的治理

NeMo Guardrails 是 NeMo 平台的一部分，这是一个用于定义、编排和执行 AI 代理及其他生成式 AI 应用模型策略的可扩展平台。

"防护机制通过对 AI 模型、代理和系统执行规范，帮助维护 AI 运营的可信度和可靠性，"Briski 说。"它有助于保持 AI 代理的正常运行。"

例如，这些新的微服务可以帮助汽车制造商创建用于车辆操作的 AI 代理，协助用户控制空调、调节座椅、娱乐信息、导航等功能。制造商可以使用这些微服务来指定禁止的话题，如其他汽车品牌或提供背书和意见。

NeMo Guardrails 利用小型语言模型 (SLMs)，其延迟低于大语言模型，这意味着它们可以在资源受限或分布式环境中高效运行。Briski 指出，这些模型非常适合在医疗保健、汽车和制造业等行业扩展 AI 应用。一些 CIO 已经开始转向 SLMs 寻求专用解决方案，将其作为更通用的大语言模型的替代方案。

虽然可以使用默认配置的 NeMo Guardrails，但 Briski 表示其真正的力量在于定制和扩展防护功能。

"使用多个可定制的防护机制很重要，因为没有一种方案能适用于所有场景，"她说。"不同用例、品牌、公司准则，甚至基于行业和地理位置的不同监管要求都有各自的政策和要求。开发人员希望能够为其特定需求和不同智能代理 AI 系统的各种要求选择合适的防护机制。"

Briski 表示，IT 部门现在将成为"代理的人力资源部门"，这正是新的微服务发挥作用的地方，允许开发人员应用多个轻量级的专用模型作为防护措施，以填补仅依靠更通用的全局策略和保护时可能出现的空白。

这些新的微服务，以及用于防护编排的 NeMo Guardrails 和 Nvidia Garak 工具包，现在都已向开发人员和企业开放使用。

来源：CIO.com

0赞

好文章，需要你的鼓励

Nvidia 推出面向智能代理 AI 的新型防护微服务

来源：CIO.com

2025

01/20

14:39

分享

点赞

“4个9”韧性的背后，西云数据以技术与运营加速企业数字化创新

Google力推手机AI功能引发关注

Meta发布AI翻译功能，支持脸书和Instagram内容实时转换

HPE发布Nvidia Blackwell驱动的AI服务器，抢占AI市场需求

ISACA推出AI安全管理高级认证项目

谷歌推出智能体SOC系统提升安全事件响应速度

Lumen升级400GB数据中心连接基础设施助力AI发展

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: