英伟达在本周的科技新闻中占据主导地位,在圣何塞举行的年度GTC大会上,其在人工智能工厂繁荣浪潮中的霸主地位进一步巩固。
英伟达发布了一系列升级的芯片和软件,并与几乎所有合作伙伴建立了新的合作关系。当公司市值徘徊在4万亿美元以上时,CEO黄仁勋预测收入将在2027年底前较之前两年翻一番,达到1万亿美元或更多。中国芯片销售也正在重新启动。
在这次规模空前的GTC大会上,黄仁勋明确表示,英伟达正全力争夺整个AI工厂硬件和软件技术栈的控制权,尽管它仍为戴尔、惠普企业、思科等其他硬件供应商留有充足空间,让它们在计算机和网络设备中使用英伟达芯片。
黄仁勋认为,必须确保AI工厂的所有组件——从芯片到存储、网络、AI模型(包括自家模型)以及协调一切的软件(包括自家CUDA计算平台和编程模型)——尽可能无缝地协同工作,他称之为"极端协同设计"。"我们是一家垂直整合的计算公司,"他本周宣称,"别无他法。"
这种强调的原因在于,现在重要的不再是大规模新模型的训练(英伟达图形处理器在此方面表现出色),而是推理——即向查询提供答案的过程。对此,不同类型的处理器效果更好且成本更低,这就是英伟达急于在今年晚些时候推出从Groq收购的语言处理单元芯片的原因,该团队于12月以200亿美元被收购。这也是英伟达将自家Rubin GPU与Vera中央处理器紧密集成的原因。"推理不是单芯片解决方案,"英伟达超大规模和高性能计算副总裁兼总经理Ian Buck在采访中告诉我,"推理更难,因为它有实时组件。"
对推理的更大重视促成了与亚马逊网络服务的扩展协议,其中不仅包括100万个GPU,还包括LPU和英伟达的Spectrum-X网络芯片——尽管AWS一直在设计自己的芯片和网络等产品。
这在智能体AI的黎明时代尤为重要。数百万甚至数十亿的智能体将持续对话,并以远超人类的速度与人类使用的软件交互。
在其他方面,为了降低AI推理成本,OpenAI和Mistral都发布了新的、更高效但仍相当强大的硬件优化模型。
OpenAI通过计划收购Python工具初创公司Astral,继续其企业业务探索。它需要加快步伐,因为Anthropic在企业AI工具领域遥遥领先。
杰夫·贝佐斯希望利用AI改造各行业的制造业,本周他据报在中东和东南亚筹集1000亿美元资金来实现这一目标。
下周将有两个大型企业展会,SiliconANGLE和theCUBE将现场报道:旧金山的网络安全会议RSAC,以及阿姆斯特丹的KubeCon+CloudNativeCon EU。
本周企业和新兴技术新闻包括:
AI和数据方面,英伟达现在就是AI工厂。
分析显示,在首次购买AI工具的公司中,Anthropic目前占据超过73%的支出份额。Meta的AI智能体失控,向无权访问的员工暴露了敏感的公司和用户数据。
在新模型和服务方面,OpenAI将推出ChatGPT超级应用和"AI研究实习生"。OpenAI和Mistral AI发布了新的硬件高效语言模型。谷歌扩大了个人智能工具的可用性。
在政策方面,白宫发布了专注于州法规和电力生成的AI政策框架。法院裁定Perplexity的AI机器人可以继续在亚马逊上运行。
在企业领域,亚马逊CEO安迪·雅西预测,得益于AI,云收入将在2036年达到6000亿美元。按需GPU初创公司Andromeda以15亿美元估值获得融资。
在网络安全方面,多家公司推出了AI驱动的安全平台和工具,包括Menlo Security、Torq、NinjaOne等。
Q&A
Q1:英伟达为什么要打造完整的AI工厂技术栈?
A:黄仁勋认为,必须确保AI工厂的所有组件——从芯片到存储、网络、AI模型以及协调软件——尽可能无缝协同工作,这种"极端协同设计"是英伟达作为垂直整合计算公司的必然选择,别无他法。
Q2:AI推理为什么比训练更重要?
A:现在重要的不再是大规模新模型的训练,而是推理——即向查询提供答案的过程。推理需要不同类型的处理器,效果更好且成本更低,还有实时组件要求,这就是英伟达推出语言处理单元芯片的原因。
Q3:智能体AI时代会带来什么变化?
A:在智能体AI的黎明时代,数百万甚至数十亿的智能体将持续对话,并以远超人类的速度与人类使用的软件交互,这要求更强大的推理能力和实时处理能力。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。