AI 代理安全卫士：Nvidia 发布新型微服务解决方案

英伟达推出新的推理微服务,旨在帮助企业开发可信、安全的 AI 代理。这些微服务包括主题控制、内容安全和越狱保护,可优化大型语言模型的响应,提高应用性能。此举将帮助企业更安全、可靠地部署生成式 AI 模型,解决 AI 代理在信任、安全等方面的关键问题。

Nvidia 公司今天宣布发布新的 Nvidia 推理微服务 (Nvidia Inference Microservices)，旨在帮助企业组织开发人工智能代理，以解决信任、安全和安全性问题。

AI 代理是一项正在蓬勃发展的技术，它正在彻底改变人们与计算机的交互方式，但同时也带来了几个关键问题。目前，主动式 AI 正在改变知识型员工完成任务的方式以及客户与品牌"对话"的方式，但底层的大语言模型仍可能出现偏差，产生不必要的响应，或者在恶意用户突破其安全防护时造成安全隐患。

Nvidia NIM 是一组容器化微服务，旨在加速生成式 AI 模型的部署。今天的公告是对 NeMo Guardrails 的扩展，后者是一个面向开发者的保护框架，用于管理 AI 模型，使其能够构建更安全、更可信的 AI 代理。

Nvidia 发布了三个 NIM 微服务，涵盖主题控制、内容安全和越狱保护。这些微服务是经过高度优化的小型轻量级 AI 模型，用于调节大型模型的响应，以提高应用程序性能。

Nvidia 企业 AI 模型、软件和服务副总裁 Kari Briski 表示："新微服务之一是为调节内容安全而构建的，它使用 Aegis 内容安全数据集进行训练，这是该类别中最高质量的人工标注数据源之一。"

该数据由 Nvidia 负责管理，包含超过 35,000 个人工标注的数据样本，用于标记 AI 安全性和绕过系统限制的越狱尝试。该数据集将于今年晚些时候在 Hugging Face 上公开。

例如，主题控制 NIM 有助于防止代理变得过于"健谈"或偏离其原始任务，使其保持在主题上。与 AI 聊天机器人的对话越长，它就越有可能忘记聊天的原始意图，对话可能开始偏离主题，这类似于人类对话的特点。虽然这对人来说可以接受，但对聊天机器人来说却是个问题，特别是对于可能开始谈论著名摇滚明星或竞争产品的品牌 AI 代理来说。

Briski 说："像 NeMo Guardrails 集合中的小型语言模型这样的模型具有更低的延迟，即使在资源受限或分布式环境中也能高效运行。这使它们非常适合在医疗保健、汽车和制造业等行业中扩展 AI 应用，比如在医院或仓库等场所。"

NIM 方法允许开发人员在最小额外延迟的情况下叠加多个保护措施。这对于大多数生成式 AI 应用程序来说非常重要，因为客户不喜欢在等待文本出现或语音开始说话时看到三个点闪烁或圆圈旋转。

Lowe's 公司数据、AI 和创新高级副总裁 Chandhu Nair 表示："我们一直在寻找帮助员工为客户提供更好服务的方法。"这家家居装修零售商与 Nvidia 合作，使用 AI 协助客户和员工。"通过最近部署的 Nvidia NeMo Guardrails，我们确保 AI 生成的响应是安全、可靠的，并强制执行对话边界，只提供相关和适当的内容。"

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

AI 代理安全卫士：Nvidia 发布新型微服务解决方案

来源：SiliconANGLE

2025

01/17

14:11

分享

点赞

图灵机的极限在哪里？DeepMind掌门人的终极追问与AGI路线图

F5 2026年技术趋势展望：AI缺陷与量子挑战并行，四大趋势重塑数字安全与韧性格局

PTC 携手兰博基尼亮相 CES 2026

AI“好产品”的年度答案，2025年度凌云奖即将揭晓

阿里云云原生数据库PolarDB

锐龙AI Max+ 395

自研架构升级，跨越“万卡”天堑 摩尔线程在物理AI时代开启“成人礼”

CIO总结2025年人工智能实用化的十大关键启示

软银竭力筹措225亿美元资金支持OpenAI

2025年十大IT领导层访谈盘点

2025年英国数据中心行业十大热点事件回顾

2025年东南亚科技领域十大热点故事

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

自研架构升级，跨越“万卡”天堑摩尔线程在物理AI时代开启“成人礼”