Nvidia 发布 NeMo 微服务助力简化 AI 代理开发

英伟达发布 NeMo 微服务，帮助企业构建自主学习、持续优化的 AI 代理，实现数据驱动的业务升级。

Nvidia 宣布其 NeMo 微服务现已全面发布，为企业提供工具，以构建能够与业务系统集成且通过数据交互持续改进的 AI 代理。此项微服务的推出正值各组织迫切寻求能够为重大科技投资带来可量化回报的具体 AI 实施策略之时。

企业 AI 面临数据整合挑战企业在采用 AI 技术时面临一大关键挑战：构建能够通过不断学习业务数据来保持准确性与实用性的系统。NeMo 微服务通过打造 Nvidia 所描述的 “数据飞轮” （data flywheel）来应对这一挑战，使 AI 系统能够通过持续接触企业信息及用户交互保持相关性。

该全新工具包包含五项核心微服务：

NeMo Customizer 负责对大语言模型进行微调，以实现更高的训练吞吐量。

NeMo Evaluator 提供针对定制基准的简化 AI 模型评估。

NeMo Guardrails 实施安全控制，确保合规并输出适当的响应。

NeMo Retriever 实现跨企业系统的信息访问。

NeMo Curator 处理与整理用于模型训练及改进的数据。

这些组件协同工作，打造出能够作为数字同事独立执行任务、仅需极少人工监管的 AI 代理。与传统的聊天机器人不同，这些代理能够自主采取行动并基于企业数据做出决策，它们可连接现有系统，以访问信息存储在组织内部的最新数据。

技术架构支持持续改进 NeMo 与 Nvidia 推理微服务（命名为 NIMs）之间的区别在于其互补功能。正如 Nvidia 企业级生成式 AI 软件部高级总监 Joey Conway 所言，“NIMs 用于推理部署——运行模型、问题输入、答复输出，而 NeMo 则专注于如何改进该模型：数据准备、训练技术、评估。”当 NeMo 完成了模型的优化后，可通过 NIM 部署到生产环境中。

早期实践已展示了显著的商业效果。电信软件供应商 Amdocs 利用 NeMo 微服务开发了三个专用代理；AT&T 与 Arize 及 Quantiphi 合作，构建了一个每周更新近 10,000 份文档的代理；而 Cisco 的 Outshift 部门与 Galileo 合作，创建了一款响应速度快于同类工具的编程助手。

这些微服务以 Docker 容器形式运行，并通过 Kubernetes 进行编排，从而实现可在多种计算环境中的部署。它们支持包括 Meta 的 Llama、Microsoft 的 Phi 系列、Google 的 Gemma 及 Mistral 在内的多种 AI 模型，Nvidia 自家的侧重推理能力的 Llama Nemotron Ultra 亦与该系统兼容。

这一发布进入了一个竞争激烈的市场，企业在 AI 开发选择上众多，包括 Amazon 的 Bedrock、Microsoft 的 Azure AI Foundry、Google 的 Vertex AI、Mistral AI、Cohere 以及 Meta 的 Llama 技术栈。Nvidia 则通过与自身硬件生态系统的深度整合以及通过 AI Enterprise 软件平台提供的企业级支持，在众多方案中脱颖而出。

Nvidia NeMo 与企业 AI 采纳对于技术团队而言，这些微服务提供了降低实施复杂性的基础设施。容器化方法使得在内部部署或云环境中都能利用企业级的安全性及稳定性特性。这种灵活性有效应对了 AI 实施过程中经常碰到的数据主权与监管合规性问题。

在评估这些工具时，组织应考虑现有 GPU 基础设施投资、数据治理需求以及与现有系统的整合需求。对于在业务数据不断变化中仍能保持准确性的 AI 代理的需求，将推动支持持续学习周期的平台的广泛应用。

这种微服务方法反映了整个行业向模块化 AI 系统转变的趋势，这类系统能够为特定业务领域量身定制，而无需重构基础组件。对技术决策者而言，此次发布代表了企业 AI 工具向成熟迈进的又一步，有效缩小了前沿研究能力与实际业务运营之间的差距。

随着企业从试验阶段迈向生产级 AI 系统，能够简化持续改进模型构建工具的重要性日益凸显。“数据飞轮”概念体现了一种架构模式，即通过不断接触组织内部信息，使 AI 系统始终与业务需求保持一致。

来源：Forbes

0赞

好文章，需要你的鼓励

Nvidia 发布 NeMo 微服务 助力简化 AI 代理开发

来源：Forbes

2025

04/27

15:10

分享

点赞

Docker统一容器开发与AI智能体工作流程

情感AI的十字路口：从马斯克的虚拟伴侣到腾讯的共情革命

CoDesign 2025国际研讨会在大阪召开 共探高性能计算与AI融合新路径

自写互联网：Dfinity的Caffeine AI是否为应用开发者敲响警钟

Meta利用AI创造低碳混凝土并用于数据中心地板浇筑

Slack宣称其AI能够理解公司的专业术语和行话

Adobe新AI工具将搞怪噪音转换成逼真音效

AI是新的Android恶意软件吗？手机厂商争夺用户注意力的战争

NetBox Labs获得3500万美元融资推动基础设施运营现代化

边缘计算趋势：采用现状、挑战与未来展望

Liqid发布支持CXL 2.0内存池的可组合GPU服务器

Uber携手Lucid和Nuro部署2万辆自动驾驶出租车

VAST 的 VUA 闪存缓存几乎扩展 GPU 服务器内存以供 AI token 生成

新研究揭示模拟推理 AI 模型尚未达到其宣传效果之原因

AI 工作负载如何重塑数据中心设计

微软在宣布近一年后推出 Windows Recall 功能面向公众

Cohesity 推出 RecoveryAgent 简化事故响应

VMware 补丁凸显支持问题

Zencoder 收购 Machinet 挑战 GitHub Copilot 随着 AI 编程助手整合加速

Omdia：全光子网络构建更安全、更智能、更可持续的世界

Microsoft 推出 Recall 及基于 AI 的 Windows 搜索功能，面向 Copilot Plus PC

数据分析加速如何解决 AI 隐藏的瓶颈

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

Nvidia 发布 NeMo 微服务助力简化 AI 代理开发

CoDesign 2025国际研讨会在大阪召开共探高性能计算与AI融合新路径