GTC聚焦NVIDIA RTX PC和DGX Spark本地运行最新开放模型和智能体

英伟达GTC大会展示了代理AI的重要进展,包括发布Nemotron 3 Nano 4B和Super 120B等新开源模型,优化Qwen 3.5和Mistral Small 4模型。推出NemoClaw开源堆栈,为OpenClaw提供本地化优化,提升安全性并支持本地模型运行。此外还介绍了Unsloth Studio简化模型微调流程。这些技术让用户可在RTX PC和DGX Spark上私密免费运行个人AI代理。

个人计算的范式一直围绕个人设备概念发展——从PC到智能手机和平板电脑。如今,生成式AI,特别是OpenClaw,引入了一个新类别:智能体计算机。这些设备,如NVIDIA DGX Spark桌面AI超级计算机或专用的NVIDIA RTX PC,是运行个人智能体的理想选择——私密且免费。

本周举行的NVIDIA GTC大会展示了多项智能体AI公告,包括:

用于本地智能体的新开放模型,包括NVIDIA Nemotron 3 Nano 4B和Nemotron 3 Super 120B,以及对Qwen 3.5和Mistral Small 4的优化。

NVIDIA NemoClaw,一个针对OpenClaw的开源堆栈,通过增强安全性和支持本地模型来优化NVIDIA设备上的OpenClaw体验。

通过Unsloth Studio更便捷的微调功能,进一步提高开放模型在智能体工作流中的准确性。

参加GTC现场活动的观众可以前往GTC Park的NVIDIA构建智能体活动,每日举办至3月19日,上午8点至下午5点。NVIDIA专家将帮助客人使用他们选择的设备定制和部署主动的、始终在线的AI助手。无论是技术专家还是好奇者,参与者都可以为他们的智能体命名,定义其个性并授予其所需的工具访问权限——创建一个可通过他们首选消息应用程序访问的个人助手。

新一代本地模型具有越来越大的上下文窗口

下一代本地模型——具有越来越大的上下文窗口——提供了在PC上运行智能体的智能能力。结合更丰富的用户上下文和强大的本地工具,这些进展正在解锁AI PC的新可能性,特别是在DGX Spark上,其128GB统一内存支持超过1200亿参数的模型。

上周发布的Nemotron 3 Super是一个1200亿参数的开放模型,具有120亿活跃参数,专为运行复杂的智能体AI系统而设计。Nemotron 3 Super最适合在DGX Spark或NVIDIA RTX PRO工作站上驱动智能体。在PinchBench——一个用于确定大语言模型在OpenClaw中表现如何的新基准测试中,Nemotron 3 Super得分85.6%,使其成为同类别中最佳的开放模型。

Mistral Small 4是一个1190亿参数的开放模型,具有60亿活跃参数——包括所有层在内为80亿参数——统一了Mistral旗舰模型的能力。用户现在拥有一个为通用聊天、编程和智能体任务优化的超高效模型。

这两个模型都可以在DGX Spark和RTX PRO GPU上本地运行。

对于寻找较小模型的GeForce RTX用户,Nemotron 3 Nano 4B是加入NVIDIA Nemotron 3开放模型系列的最新模型,为在RTX AI PC上本地构建智能体和助手提供了紧凑、高能力的起点。该模型非常适合在资源受限的硬件上构建游戏和应用中的行动型对话角色。它可在任何支持NVIDIA GPU的系统上使用,将最先进的指令遵循和出色的工具使用与最小的VRAM占用相结合。

此外,NVIDIA宣布了对阿里巴巴Qwen 3.5模型的优化,这些模型展现了出色的准确性(27B、9B和4B),适合在NVIDIA GPU上运行本地智能体。新模型原生支持视觉、多token预测和262,000 token的大上下文窗口。1270亿参数的密集模型在与RTX 5090 GPU配对时表现卓越。

用户今天可以通过Ollama、LM Studio和llama.cpp试用这些模型,由RTX GPU和DGX Spark提供加速推理。了解更多关于NVIDIA开放模型的最新信息。

LTX 2.3和FLUX.2 Klein获得性能提升

本月早些时候发布的Lightricks最先进的音频-视频模型LTX 2.3,现在支持NVFP4和FP8蒸馏模型,将性能提升2.1倍。了解更多关于Lightricks LTX 2.3模型的信息。

此外,Black Forest Lab的FLUX.2 Klein 9B上周收到更新,图像编辑速度提升多达2倍。NVIDIA与Black Forest Labs合作发布了FP8版本,针对RTX GPU的最快性能和最优内存消耗进行了优化。

NemoClaw为OpenClaw提供本地、安全的体验

AI开发者和爱好者正在购买DGX Spark超级计算机或构建专用RTX PC来运行自主AI智能体,如OpenClaw,这些智能体从个人文件、应用程序和工作流中获取上下文,并可以自动化日常任务。然而,随着OpenClaw等智能体系统的采用增长,人们对token成本以及安全和隐私的担忧也在增加。

为了帮助解决这些问题,NVIDIA本周推出了NemoClaw,这是一个针对OpenClaw的开源堆栈,为NVIDIA设备上的OpenClaw部署优化。NemoClaw的第一批功能包括NVIDIA Nemotron开放模型和NVIDIA OpenShell运行时。Nemotron本地模型使用户能够在本地运行推理,这意味着更好的隐私和零token成本。OpenShell是专为更安全执行智能体而设计的运行时。

了解更多关于NemoClaw的信息。观看NVIDIA创始人兼CEO黄仁勋的GTC主题演讲并探索会议内容。

Unsloth Studio简化模型微调

随着开放模型取得巨大飞跃,进一步提高准确性的一种方法是微调,它允许用户为自己的数据和用例定制模型。这种技术通常需要深入的技术专业知识、编程知识和大量配置。Unsloth是模型微调和对齐的领先开源库,今天推出了Unsloth Studio,一个易于使用的基于Web的用户界面,简化了AI爱好者和开发者的微调过程。

Unsloth Studio支持超过500个AI模型。简单的用户界面使训练和微调过程变得简单:用户只需拖入数据集,点击基于图形的画布生成额外的高质量合成数据并启动微调作业。它支持量化低秩适应、低秩适应和完全微调。在模型微调过程中,用户可以监控和可视化作业进度。最后,他们可以将模型导出到选择的框架中并进行对话,所有这些都在同一个Web应用程序内完成。

Unsloth Studio的新界面基于Unsloth库构建,使用定制和专用的GPU内核,提供高达2倍的训练速度和高达70%的VRAM节省。这意味着新用户可以开箱即用地充分利用他们的NVIDIA RTX GPU和DGX Spark。

今天就试用Unsloth Studio,包括Nemotron 3 Nano 4B和Qwen 3.5等新模型。查看其他RTX AI Garage文章,了解更多关于使用NVIDIA GeForce RTX GPU微调模型的信息。

附加更新

RTX AI视频生成指南,展示ComfyUI中的RTX Video:今年早些时候在CES上发布的新RTX AI视频生成指南展示了创作者和爱好者如何从概念到创作,使用引导的文本到图像工作流制作AI生成视频的关键帧,然后使用在本地GPU上运行的RTX Video技术放大到4K。开始使用指南并在社交媒体上分享作品,标签为#AIonRTX。

Q&A

Q1:Nemotron 3 Super 120B模型有什么特别之处?

A:Nemotron 3 Super是一个1200亿参数的开放模型,具有120亿活跃参数,专为运行复杂的智能体AI系统而设计。在PinchBench基准测试中得分85.6%,是同类别中最佳的开放模型,最适合在DGX Spark或NVIDIA RTX PRO工作站上驱动智能体。

Q2:NemoClaw能解决什么问题?

A:NemoClaw是针对OpenClaw的开源堆栈,主要解决智能体系统采用中的token成本、安全和隐私问题。它包含NVIDIA Nemotron开放模型和OpenShell运行时,Nemotron本地模型使用户能够在本地运行推理,提供更好的隐私保护和零token成本。

Q3:Unsloth Studio适合什么样的用户使用?

A:Unsloth Studio适合AI爱好者和开发者使用,它提供易于使用的基于Web的用户界面来简化模型微调过程。用户只需拖入数据集就能开始微调,支持超过500个AI模型,使用定制GPU内核提供高达2倍训练速度和70%VRAM节省。

来源:NVIDIA

0赞

好文章,需要你的鼓励

2026

03/18

17:17

分享

点赞

邮件订阅