Cerebras Systems 的晚餐盘大小芯片目前为 Meta 提供最新 AI 推理产品,同时不久后也将供 IBM 使用,但美国的贸易政策对其全球前景产生了重大影响。
" AI 扩散规则是一项糟糕的政策,"Cerebras 首席执行官 Andrew Feldman 在 IBM 年度 Think 大会开幕前的新闻发布会上表示。
除非特朗普政府介入,否则这些以及其他与 AI 相关的规定将在本月晚些时候生效。这些规定是在前总统 Joe Biden 任期末的最后时刻提出的,旨在限制美国 GPU 和 AI 加速器向美国以外,以及除少数美国盟友之外的国家销售。
该政策的目标之一是防止中国及其他受限国家通过直接从允许购买美国加速器的国家获得产品来规避禁令。
然而,尽管一些 AI 初创公司呼吁对 AI 出口实施更严格的管控,美国芯片公司却对此持反对态度。上周,Nvidia 首席执行官 Jensen Huang——其庞大的 GPU 帝国将因这些规定遭受最大损失——呼吁特朗普政府对规定进行修订。
从本质上来看,扩散规则将实施严格的出口管制,并且除美国认为是盟友的 18 个受青睐国家外,每个国家每年仅能获得少量芯片分配。芯片制造商更希望政府不要具体规定他们可以向谁销售多少产品,因为这会限制他们能触及的总体市场。以往,政府在处理安全问题时通常是将特定国家加入 US Entities 列表,之后供应商便需要获得特殊许可证才能与这些国家开展业务。
Feldman 一直对 Nvidia 持批评态度,此前曾指责该公司通过继续为中国制造和销售符合制裁要求的加速器而“武装”中国。但在此问题上,他也认为扩散规则过于严格。他还指出,许多其他科技巨头也持同样看法。
他说:“你知道让我、Nvidia、Oracle、Google、Amazon 和 Microsoft 在某件事上达成一致有多困难。让整个竞争行业的人达成一致更是难上加难,而那项政策并不是一项好政策。”
Feldman 补充道:“我们希望美国的出口,包括技术出口,都掌握在我们盟友手中,同时支持美国企业在这一过程中发展。我们需要合理的防范措施,确保设备不会流入中国或被中国人使用;如果有公司对其设备被中国或其他对手使用视而不见,我们需要真正的惩罚措施。我认为扩散规则未能实现这些目标,我相信我们还可以做得更好。”
Feldman 也承认,美国商务部在制定既保护美国利益又不妨碍美国企业在全球开展业务的贸易政策方面面临较大难题。他表示:“我希望我们能回归到更周全的政策,而不是无政策。”
Feldman 对关税对供应链的影响并不太担心。这部分原因在于 Cerebras 的晚餐盘大小芯片是在 TSMC 制造的,但更关键的是,他指出这些芯片并不依赖中国的组件。
他说:“我认为不确定性和意外情况确实让人头疼,这对每个人的供应链都会造成影响。你采购子组件,从其他厂家购买零件,总有人得弄清楚这些部件究竟是产自墨西哥、马来西亚还是奥斯汀;这需要耗费大量的时间和精力。提前给我们一些预警,至少我们不会像无头苍蝇一样到处乱跑,苦苦琢磨定价该怎么算,”他补充道,并指出这些额外成本最终都会转嫁给最终客户。
对于 Cerebras 来说,较高的组件成本在未来可能会带来问题,因为该公司的商业模式——至少在推理领域——已经依赖客户愿意为其生成过程中速度优势支付溢价。据 Artificial Analysis 测算,Cerebras 运行 Llama 4 Scout 时每秒可处理超过 2,600 个 Token,远远领先于诸如 Fireworks 或 Together.ai 等基于 GPU 的 API 供应商(后者每秒大约只能处理 130 个 Token)。但虽说速度比竞争对手快数倍,其价格也处于高端水平。
尽管如此,许多人愿意为此买单,正如我们周二看到 IBM 与 Cerebras 形成合作一样。Big Blue 的 Watson-X AI Gateway 至少部分将运行在 Cerebras 的晶圆级加速器上。
不过,在你过于兴奋之前,需要指出的是,IBM 并没有部署 Cerebras CS-3 集群。该合作协议与 IBM 与 Hugging Face 的合作十分相似,即 IBM 提供通用的 API 接口和计费平台,而实际的推理工作负载则在 Cerebras 数据中心运行。
就在一周前,Cerebras 又取得了另一项胜利,当时 Meta 确认其新 Llama API 服务中至少一部分也将基于 Cerebras 的硬件运行。
这些胜利有助于该公司实现客户群的多元化。直到最近,Cerebras 极度依赖总部位于阿联酋的 AI 云服务提供商 G42,该公司在 2024 年上半年贡献了其 87% 的收入。
阿联酋是中东多个国家之一,在这些国家中,美国设计的 AI 加速器出货仍受到严格限制。G42 通过资助在美国建设几台 Cerebras AI 超级计算机,从而规避了许多这类挑战。
尽管有谣传称特朗普政府可能会放宽对阿联酋 AI 加速器的限制,但除非特朗普政府彻底取消这些限制,否则阿联酋在计算能力方面仍将受到 AI 扩散规则的约束。这可能也是 G42 据称已设立美国分部的原因之一。
好文章,需要你的鼓励
Oura 在其健康监测智能戒指中引入 AI 技术,通过整合餐食记录与 Dexcom Stelo 血糖数据,为用户提供个性化代谢健康建议,实现全面健康管理。
ServiceNow 新推出的 AI Control Tower 可一站式管理企业所有 AI 系统、代理及流程,支持实时监控、全生命周期管理及多协议互通。
本文介绍了Google DeepMind推出的升级版Gemini 2.5 Pro I/O版,其在代码生成方面表现卓越,刷新了相关基准测试成绩,并获得开发者一致好评,加速真实编程场景落地应用。
文章论述了人工智能引发的“认知迁徙”及其对工作、教育和文化的深远重构,强调人类在创造性、情感和伦理等领域的独特优势。