Cerebras Systems 的晚餐盘大小芯片目前为 Meta 提供最新 AI 推理产品,同时不久后也将供 IBM 使用,但美国的贸易政策对其全球前景产生了重大影响。
" AI 扩散规则是一项糟糕的政策,"Cerebras 首席执行官 Andrew Feldman 在 IBM 年度 Think 大会开幕前的新闻发布会上表示。
除非特朗普政府介入,否则这些以及其他与 AI 相关的规定将在本月晚些时候生效。这些规定是在前总统 Joe Biden 任期末的最后时刻提出的,旨在限制美国 GPU 和 AI 加速器向美国以外,以及除少数美国盟友之外的国家销售。
该政策的目标之一是防止中国及其他受限国家通过直接从允许购买美国加速器的国家获得产品来规避禁令。
然而,尽管一些 AI 初创公司呼吁对 AI 出口实施更严格的管控,美国芯片公司却对此持反对态度。上周,Nvidia 首席执行官 Jensen Huang——其庞大的 GPU 帝国将因这些规定遭受最大损失——呼吁特朗普政府对规定进行修订。
从本质上来看,扩散规则将实施严格的出口管制,并且除美国认为是盟友的 18 个受青睐国家外,每个国家每年仅能获得少量芯片分配。芯片制造商更希望政府不要具体规定他们可以向谁销售多少产品,因为这会限制他们能触及的总体市场。以往,政府在处理安全问题时通常是将特定国家加入 US Entities 列表,之后供应商便需要获得特殊许可证才能与这些国家开展业务。
Feldman 一直对 Nvidia 持批评态度,此前曾指责该公司通过继续为中国制造和销售符合制裁要求的加速器而“武装”中国。但在此问题上,他也认为扩散规则过于严格。他还指出,许多其他科技巨头也持同样看法。
他说:“你知道让我、Nvidia、Oracle、Google、Amazon 和 Microsoft 在某件事上达成一致有多困难。让整个竞争行业的人达成一致更是难上加难,而那项政策并不是一项好政策。”
Feldman 补充道:“我们希望美国的出口,包括技术出口,都掌握在我们盟友手中,同时支持美国企业在这一过程中发展。我们需要合理的防范措施,确保设备不会流入中国或被中国人使用;如果有公司对其设备被中国或其他对手使用视而不见,我们需要真正的惩罚措施。我认为扩散规则未能实现这些目标,我相信我们还可以做得更好。”
Feldman 也承认,美国商务部在制定既保护美国利益又不妨碍美国企业在全球开展业务的贸易政策方面面临较大难题。他表示:“我希望我们能回归到更周全的政策,而不是无政策。”
Feldman 对关税对供应链的影响并不太担心。这部分原因在于 Cerebras 的晚餐盘大小芯片是在 TSMC 制造的,但更关键的是,他指出这些芯片并不依赖中国的组件。
他说:“我认为不确定性和意外情况确实让人头疼,这对每个人的供应链都会造成影响。你采购子组件,从其他厂家购买零件,总有人得弄清楚这些部件究竟是产自墨西哥、马来西亚还是奥斯汀;这需要耗费大量的时间和精力。提前给我们一些预警,至少我们不会像无头苍蝇一样到处乱跑,苦苦琢磨定价该怎么算,”他补充道,并指出这些额外成本最终都会转嫁给最终客户。
对于 Cerebras 来说,较高的组件成本在未来可能会带来问题,因为该公司的商业模式——至少在推理领域——已经依赖客户愿意为其生成过程中速度优势支付溢价。据 Artificial Analysis 测算,Cerebras 运行 Llama 4 Scout 时每秒可处理超过 2,600 个 Token,远远领先于诸如 Fireworks 或 Together.ai 等基于 GPU 的 API 供应商(后者每秒大约只能处理 130 个 Token)。但虽说速度比竞争对手快数倍,其价格也处于高端水平。
尽管如此,许多人愿意为此买单,正如我们周二看到 IBM 与 Cerebras 形成合作一样。Big Blue 的 Watson-X AI Gateway 至少部分将运行在 Cerebras 的晶圆级加速器上。
不过,在你过于兴奋之前,需要指出的是,IBM 并没有部署 Cerebras CS-3 集群。该合作协议与 IBM 与 Hugging Face 的合作十分相似,即 IBM 提供通用的 API 接口和计费平台,而实际的推理工作负载则在 Cerebras 数据中心运行。
就在一周前,Cerebras 又取得了另一项胜利,当时 Meta 确认其新 Llama API 服务中至少一部分也将基于 Cerebras 的硬件运行。
这些胜利有助于该公司实现客户群的多元化。直到最近,Cerebras 极度依赖总部位于阿联酋的 AI 云服务提供商 G42,该公司在 2024 年上半年贡献了其 87% 的收入。
阿联酋是中东多个国家之一,在这些国家中,美国设计的 AI 加速器出货仍受到严格限制。G42 通过资助在美国建设几台 Cerebras AI 超级计算机,从而规避了许多这类挑战。
尽管有谣传称特朗普政府可能会放宽对阿联酋 AI 加速器的限制,但除非特朗普政府彻底取消这些限制,否则阿联酋在计算能力方面仍将受到 AI 扩散规则的约束。这可能也是 G42 据称已设立美国分部的原因之一。
好文章,需要你的鼓励
人工智能初创公司Counterintuitive Corp.正式发布,旨在通过开发专为推理而非模仿设计的芯片和软件来重新定义AI。该公司提出人工推理单元(ARU)这一全新计算架构类别,以解决现代AI面临的"精度无真理、推理无记忆"双重困境。ARU采用确定性、记忆驱动的推理架构,配合全栈推理软件,承诺突破当前AI局限性,开启后GPU时代的智能计算新纪元。
北京大学团队开发出WoW世界模型,这是首个真正理解物理规律的AI系统。通过200万机器人互动数据训练,WoW不仅能生成逼真视频,更能理解重力、碰撞等物理定律。其创新的SOPHIA框架让AI具备自我纠错能力,在物理理解测试中达到80.16%准确率。该技术将推动智能机器人、视频制作等领域发展,为通用人工智能奠定重要基础。
全球最大云服务提供商亚马逊云服务(AWS)遭遇大规模故障,影响政府机构、AI公司和金融平台等众多客户。尽管AWS称已基本恢复,但仍有用户无法连接租用服务器。故障源于关键数据库服务的数字目录故障,导致依赖该数据库的软件无法获取信息而出现连锁反应。受影响服务包括Venmo、苹果音乐、Zoom等数百个网站和应用。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。