Cerebras Systems 的晚餐盘大小芯片目前为 Meta 提供最新 AI 推理产品,同时不久后也将供 IBM 使用,但美国的贸易政策对其全球前景产生了重大影响。
" AI 扩散规则是一项糟糕的政策,"Cerebras 首席执行官 Andrew Feldman 在 IBM 年度 Think 大会开幕前的新闻发布会上表示。
除非特朗普政府介入,否则这些以及其他与 AI 相关的规定将在本月晚些时候生效。这些规定是在前总统 Joe Biden 任期末的最后时刻提出的,旨在限制美国 GPU 和 AI 加速器向美国以外,以及除少数美国盟友之外的国家销售。
该政策的目标之一是防止中国及其他受限国家通过直接从允许购买美国加速器的国家获得产品来规避禁令。
然而,尽管一些 AI 初创公司呼吁对 AI 出口实施更严格的管控,美国芯片公司却对此持反对态度。上周,Nvidia 首席执行官 Jensen Huang——其庞大的 GPU 帝国将因这些规定遭受最大损失——呼吁特朗普政府对规定进行修订。
从本质上来看,扩散规则将实施严格的出口管制,并且除美国认为是盟友的 18 个受青睐国家外,每个国家每年仅能获得少量芯片分配。芯片制造商更希望政府不要具体规定他们可以向谁销售多少产品,因为这会限制他们能触及的总体市场。以往,政府在处理安全问题时通常是将特定国家加入 US Entities 列表,之后供应商便需要获得特殊许可证才能与这些国家开展业务。
Feldman 一直对 Nvidia 持批评态度,此前曾指责该公司通过继续为中国制造和销售符合制裁要求的加速器而“武装”中国。但在此问题上,他也认为扩散规则过于严格。他还指出,许多其他科技巨头也持同样看法。
他说:“你知道让我、Nvidia、Oracle、Google、Amazon 和 Microsoft 在某件事上达成一致有多困难。让整个竞争行业的人达成一致更是难上加难,而那项政策并不是一项好政策。”
Feldman 补充道:“我们希望美国的出口,包括技术出口,都掌握在我们盟友手中,同时支持美国企业在这一过程中发展。我们需要合理的防范措施,确保设备不会流入中国或被中国人使用;如果有公司对其设备被中国或其他对手使用视而不见,我们需要真正的惩罚措施。我认为扩散规则未能实现这些目标,我相信我们还可以做得更好。”
Feldman 也承认,美国商务部在制定既保护美国利益又不妨碍美国企业在全球开展业务的贸易政策方面面临较大难题。他表示:“我希望我们能回归到更周全的政策,而不是无政策。”
Feldman 对关税对供应链的影响并不太担心。这部分原因在于 Cerebras 的晚餐盘大小芯片是在 TSMC 制造的,但更关键的是,他指出这些芯片并不依赖中国的组件。
他说:“我认为不确定性和意外情况确实让人头疼,这对每个人的供应链都会造成影响。你采购子组件,从其他厂家购买零件,总有人得弄清楚这些部件究竟是产自墨西哥、马来西亚还是奥斯汀;这需要耗费大量的时间和精力。提前给我们一些预警,至少我们不会像无头苍蝇一样到处乱跑,苦苦琢磨定价该怎么算,”他补充道,并指出这些额外成本最终都会转嫁给最终客户。
对于 Cerebras 来说,较高的组件成本在未来可能会带来问题,因为该公司的商业模式——至少在推理领域——已经依赖客户愿意为其生成过程中速度优势支付溢价。据 Artificial Analysis 测算,Cerebras 运行 Llama 4 Scout 时每秒可处理超过 2,600 个 Token,远远领先于诸如 Fireworks 或 Together.ai 等基于 GPU 的 API 供应商(后者每秒大约只能处理 130 个 Token)。但虽说速度比竞争对手快数倍,其价格也处于高端水平。
尽管如此,许多人愿意为此买单,正如我们周二看到 IBM 与 Cerebras 形成合作一样。Big Blue 的 Watson-X AI Gateway 至少部分将运行在 Cerebras 的晶圆级加速器上。
不过,在你过于兴奋之前,需要指出的是,IBM 并没有部署 Cerebras CS-3 集群。该合作协议与 IBM 与 Hugging Face 的合作十分相似,即 IBM 提供通用的 API 接口和计费平台,而实际的推理工作负载则在 Cerebras 数据中心运行。
就在一周前,Cerebras 又取得了另一项胜利,当时 Meta 确认其新 Llama API 服务中至少一部分也将基于 Cerebras 的硬件运行。
这些胜利有助于该公司实现客户群的多元化。直到最近,Cerebras 极度依赖总部位于阿联酋的 AI 云服务提供商 G42,该公司在 2024 年上半年贡献了其 87% 的收入。
阿联酋是中东多个国家之一,在这些国家中,美国设计的 AI 加速器出货仍受到严格限制。G42 通过资助在美国建设几台 Cerebras AI 超级计算机,从而规避了许多这类挑战。
尽管有谣传称特朗普政府可能会放宽对阿联酋 AI 加速器的限制,但除非特朗普政府彻底取消这些限制,否则阿联酋在计算能力方面仍将受到 AI 扩散规则的约束。这可能也是 G42 据称已设立美国分部的原因之一。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。