中国搜索巨头百度本周发布了两款全新AI加速器,这是在国家推动摆脱对西方芯片依赖背景下的重要举措。
百度是生成式AI技术的早期采用者,开发了文心等大语言模型系列。与亚马逊和谷歌等西方云服务提供商一样,百度多年来一直在设计定制加速器。
据《南华早报》报道,这家搜索提供商的最新一代芯片旨在降低推理成本并支持更大、更复杂的架构。
公司计划明年发布新的推理优化芯片M100。该芯片由其昆仑芯片业务部门开发,旨在更好地服务下一代专家混合模型。正如我们最近探讨的,专家混合架构在大规模推理方面面临特殊挑战,特别是当模型规模超出单个加速器或服务器时。在许多情况下,互连带宽和延迟成为瓶颈,影响性能。
百度似乎通过构建更大的计算域来规避这一特定问题,这与AMD和英伟达在其机架级架构方面的做法相似。百度计划从2026年初开始以名为天池256的集群配置提供这些芯片。顾名思义,该配置将配备256个M100加速器。
据报道,百度将在2026年底推出天池512,将系统扩展到更大的计算域,使系统的推理能力翻倍。
除了推理服务,百度还在开发一款更强大的训练优化芯片M300,将于2027年首次亮相。该芯片旨在支持多万亿参数模型的训练,这类模型在过去一年中变得越来越普遍,月之暗面的Kimi K2就是一个例子。
除了新的硅芯片,百度还宣布了文心5.0,这是其最新的基础模型,能够处理文本、图像、音频和视频。
百度的最新硬件凸显了中国在战略上从英伟达加速器转向的趋势。据报道,北京官员向科技巨头施压,要求其放弃西方供应商,转而支持国内替代方案。
上周,英伟达首席执行官黄仁勋承认,在中国销售其Blackwell加速器的努力已经停滞,目前没有"积极的讨论"。
这种巨大变化推动了华为和其他中国芯片制造商(包括壁仞、寒武纪科技和燧原科技)将国产GPU推向市场的努力。
今年早些时候,我们研究了华为新的CloudMatrix 384机架设备。虽然在效率上远不及英伟达的Blackwell系列,但它们通过纯粹的规模来弥补这一点。
Q&A
Q1:百度M100芯片有什么特点?什么时候发布?
A:M100是百度计划明年发布的新一代推理优化芯片,由昆仑芯片业务部门开发,专门用于更好地服务下一代专家混合模型,旨在降低推理成本并支持更复杂的架构。
Q2:天池256和天池512系统有什么区别?
A:天池256将从2026年初开始提供,配备256个M100加速器。天池512将在2026年底推出,是更大的计算域配置,推理能力是天池256的两倍。
Q3:百度为什么要开发自己的AI芯片?
A:这是响应中国国家推动摆脱对西方芯片依赖的战略需求。北京官员向科技企业施压,要求放弃西方供应商转而支持国内替代方案,英伟达在中国的销售也已停滞。
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
JETSPEC是由UC San Diego等机构联合提出的推测解码框架,通过树形因果掩码让草稿头在一次前向传播中生成分支一致的候选树,在MATH-500上实现最高9.64倍端到端加速。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
本文介绍了中国科学院自动化所的研究,揭示了大型语言模型在多轮工具调用强化学习中崩溃的根本原因,并系统评估了五种监督信号对训练稳定性和泛化能力的影响。