英伟达CEO黄仁勋表示,公司正在"重新定义个人电脑"。微软和英伟达正在密切合作,为英伟达备受期待的RTX Spark发布做准备。这是一款基于Arm架构的新型系统级芯片(SoC)平台,将英伟达的Blackwell架构引入轻薄型Windows笔记本电脑和迷你台式机。其目标是为运行个人智能体、创意工作和游戏提供高性能处理能力,同时无需独立显卡通常所需的空间、功耗和散热要求。
RTX Spark加入了高通骁龙X处理器的Windows on Arm阵营,同样宣称具有"全天候续航"能力。骁龙处理器确实能做到这一点,但需要记住的是,英伟达芯片的设计目标是处理比骁龙处理器重得多的工作负载。
骁龙处理器并非为"渲染超过90GB的超大型3D场景、编辑12K 4:2:2视频、生成4K AI视频、在本地使用智能体运行1200亿参数的大语言模型(支持多达100万Token上下文)以及以1440p分辨率和超过100帧每秒的速度玩3A游戏"而设计,所有这些都会大幅消耗电池续航。RTX Spark能否在正常使用下达到这些目标还有待观察。
这是英伟达计划推出的跨多个价格段芯片系列中的第一款。首批型号计划于今年秋季发货,包括:
微软Surface Laptop Ultra
戴尔XPS 16
华硕ProArt P14和P16
惠普Omnibook X 14、Omnibook Ultra 16
联想Yoga Pro 9n
微星Prestige N16 Flip AI
15英寸的Surface Laptop Ultra尤其值得关注,因为微软已经很久没有更新其屏幕了,而且Surface系列(台式机和笔记本)从未配备过与其价格相匹配的独立GPU。Ultra配备了更高分辨率(262ppi)的15英寸mini LED触摸屏,支持HDR(峰值亮度达2000尼特),不同于旧款平庸的型号。微软已经三年没有更新Surface Laptop Studio了,如果微软计划让它重获新生,这款芯片和屏幕正是它所需要的。
还将推出迷你台式机。由于开发者的需求,这类产品似乎正在复苏——至少提供此类产品的制造商数量在增加。RTX Spark型号将与基于AMD Ryzen AI Halo的型号竞争。预计宏碁、华硕、戴尔、惠普和联想等公司都会推出相关产品。
英伟达计划为每一代芯片提供台式机、笔记本和工作站版本。
鉴于当前价格波动,在产品接近发货前我们无法得知具体价格。生成式AI对组件的巨大需求——以及制造这些组件所需的资源——已经造成内存、处理器和SSD存储的严重短缺,推高了电脑和手机价格,甚至影响了可用的配置选项。
技术规格
该芯片是DGX Spark(GB10)的衍生产品,后者为基于Linux的紧凑型台式机提供动力,专门针对开发者,现在也用于基于Windows的DGX工作站。Spark是与联发科联合设计的,规格与DGX相似:6144个CUDA核心、20核Grace CPU、可访问高达128GB RAM等。英伟达表示它支持多达1200亿参数的智能体,上下文长度为100万Token。(作为参考,AMD表示其顶级Ryzen AI Max Pro 400系列芯片可以处理多达3000亿参数的模型)。
其GPU规格大致相当于RTX 5070,但统一内存架构意味着它可以访问比12GB多得多的RAM。不过英伟达表示系统配置最低可以是16GB,这意味着当独立的5070(配备12GB显存)可能不会出现瓶颈时,它可能会遇到瓶颈。该公司给出的游戏性能参考是1440p分辨率下100fps(尽管不清楚这是否启用了DLSS 4.5)。
英伟达声称该芯片的整体AI性能为1 PFLOPS(每秒十亿次浮点运算),但这是基于FP4计算的。一方面,FP4是当前数据格式的宠儿,因为它比其他浮点选择更快,比整数更准确,但也存在一些权衡。(Procyon提供了一个很好的视觉示例,说明速度与准确性权衡对图像生成的意义)。但在消费级SoC中,这是第一款在硬件上支持FP4的产品。
这款芯片真正的竞争对手是M5 Pro和M5 Max MacBook Pro,它们针对相同的用户群体,但M5系列不支持FP4和FP8数据类型,这可能会成为一个障碍。
芯片本身的功耗范围从"个位数"到80W,这意味着你需要特别注意笔记本是以全功率运行还是制造商对其进行了限制。换句话说,性能,尤其是电池供电时的性能,可能会有很大差异。通常,移动处理器的功耗范围是较小的区间;例如,英特尔酷睿X9 388H指定为15W-85W。
它配备了NPU,英伟达似乎不太愿意多谈这个,但搭载Spark的系统被认为符合Copilot Plus资格,因此它必须能够达到至少40 TOPS。
RTX Spark可能看起来很强大,但英伟达仍在维持其专业市场和消费市场之间的严格划分。例如,它不打算为应用程序运行认证计划或支持ECC内存。
软件支持
除了作为英伟达Surface Laptop Ultra的发布合作伙伴之一,微软一直在对Windows进行必要的更新,以充分利用这款新芯片。
与高通的骁龙X系列处理器一样,Windows本身并不像支持英特尔和AMD的x86架构芯片那样原生支持Arm指令集,后者是PC的基础。相反,基于Arm的系统使用名为Prism的模拟层来转换指令。模拟是基于高通芯片的早期系统遇到性能和兼容性问题的部分原因。
支持硬件所需的许多Windows更新都在底层进行,但有一个会直接出现在你面前:微软将把Spark驱动的智能体放在任务栏上。
我们最近在Windows中看到的许多变化都在为此奠定基础。Prism是专门为高通的SoC编写的,因为它是操作系统需要运行的唯一基于Arm的芯片。支持RTX Spark意味着更新Prism和Windows的其他核心部分,以有效地在CPU核心之间分配工作负载、平衡散热和性能、寻址并智能管理GPU可用的更大统一内存(用于使用TensorRT进行AI处理)等。
出于显而易见的原因,高通在Windows游戏性能上的投入远不及英伟达。例如,英伟达一直在与微软合作,改善与反作弊软件(如Epic的Easy Anti-Cheat)的兼容性,这些软件曾阻止某些游戏在设备上运行,同时还支持Xbox应用,这是微软"随处游戏"战略的关键。
Adobe也在重新设计其成像引擎的部分功能,以直接利用Spark,特别是通过几个新管道来加速更多GPU和AI密集型功能,如在Premiere Pro中渲染复杂时间线以及改进Photoshop中的自然画笔。虽然CUDA和TensorRT已经在英伟达的独立移动GPU上运行,但要在这种不同的架构上充分利用它们需要进行一些调整。这些应用程序还将能够与Windows智能体交互。
此外,英伟达正在将OpenShell——其运行智能体的安全协议——移植到Windows,通过微软将在6月第一周的Build大会上公布的新控制措施。理论上,OpenShell允许你为智能体定义防护栏,根据你的隐私政策将查询路由到经批准的本地模型,并在查询基于云的模型时让它"伪装"个人信息。
英伟达正试图将日常智能体应用扩展到开发者之外,认为"广泛采用一直受到无法在用户主要PC上安全和私密地运行智能体的限制"。我怀疑信任问题比这更复杂。该公司表示,OpenShell将被整合到当前流行的智能体工具OpenClaw和Hermes中。
Q&A
Q1:英伟达RTX Spark芯片有什么特别之处?
A:RTX Spark是英伟达推出的基于Arm架构的系统级芯片,将Blackwell架构引入轻薄型Windows设备。它配备6144个CUDA核心、20核Grace CPU,可访问高达128GB RAM,支持1200亿参数的大语言模型和100万Token上下文。其GPU性能大致相当于RTX 5070,但采用统一内存架构,功耗范围从个位数到80W,可以处理3D渲染、12K视频编辑、AI视频生成和高帧率游戏等重度工作负载。
Q2:RTX Spark芯片的笔记本什么时候上市?
A:首批搭载RTX Spark芯片的设备计划于2025年秋季发货,包括微软Surface Laptop Ultra、戴尔XPS 16、华硕ProArt P14和P16、惠普Omnibook系列、联想Yoga Pro 9n和微星Prestige N16 Flip AI等。此外还会有迷你台式机版本,预计来自宏碁、华硕、戴尔、惠普和联想等厂商。具体价格要等到接近发货时才能确定。
Q3:Windows on Arm系统如何运行传统x86应用程序?
A:Windows on Arm系统使用名为Prism的模拟层来转换x86指令,因为Windows本身并不像支持英特尔和AMD芯片那样原生支持Arm指令集。为了支持RTX Spark,微软正在更新Prism和Windows核心部分,以有效分配工作负载、平衡性能和散热、管理统一内存等。英伟达还与微软合作改善反作弊软件兼容性和Xbox应用支持,Adobe也在重新设计其成像引擎以充分利用Spark架构。
好文章,需要你的鼓励
随着制造商面临提升生产力、质量和韧性的压力,自动化正成为现代工厂运营的核心。全球最大合同制造商之一Flex近期扩大了与Teradyne Robotics的合作,将在自有工厂部署机器人解决方案并为客户制造关键机器人组件。该公司运营卓越与转型总裁分享了从试点项目到大规模实施的经验,探讨协作机器人、自主移动机器人如何平衡灵活性与标准化,以及物理AI在工厂环境中的实际应用前景。
研究揭示多源视觉融合并非总有益,提出MARS框架通过单源锚点量化信息增益,动态调节多源融合优势,在多个视觉推理任务上实现显著性能提升。
仓储自动化已进入新阶段,技术挑战从单一任务验证转向规模化部署。Plus One Robotics运营副总裁Christina Gomez-Terry分享了该公司累计完成20亿次拣选后的经验:硬件故障往往在大规模部署后才显现,可维护性和可靠性比峰值性能更重要,人机协作将是长期运营模式,而系统集成可能成为仓储自动化的下一个主要瓶颈。
MiniMax发布M2系列混合专家大模型,总参数2299亿但每次仅激活98亿,通过专项数据流水线、Forge强化学习系统和自进化机制,在代理编程、深度搜索等任务上达到顶级闭源模型水平。