Cerebras Systems 的晚餐盘大小芯片目前为 Meta 提供最新 AI 推理产品,同时不久后也将供 IBM 使用,但美国的贸易政策对其全球前景产生了重大影响。
" AI 扩散规则是一项糟糕的政策,"Cerebras 首席执行官 Andrew Feldman 在 IBM 年度 Think 大会开幕前的新闻发布会上表示。
除非特朗普政府介入,否则这些以及其他与 AI 相关的规定将在本月晚些时候生效。这些规定是在前总统 Joe Biden 任期末的最后时刻提出的,旨在限制美国 GPU 和 AI 加速器向美国以外,以及除少数美国盟友之外的国家销售。
该政策的目标之一是防止中国及其他受限国家通过直接从允许购买美国加速器的国家获得产品来规避禁令。
然而,尽管一些 AI 初创公司呼吁对 AI 出口实施更严格的管控,美国芯片公司却对此持反对态度。上周,Nvidia 首席执行官 Jensen Huang——其庞大的 GPU 帝国将因这些规定遭受最大损失——呼吁特朗普政府对规定进行修订。
从本质上来看,扩散规则将实施严格的出口管制,并且除美国认为是盟友的 18 个受青睐国家外,每个国家每年仅能获得少量芯片分配。芯片制造商更希望政府不要具体规定他们可以向谁销售多少产品,因为这会限制他们能触及的总体市场。以往,政府在处理安全问题时通常是将特定国家加入 US Entities 列表,之后供应商便需要获得特殊许可证才能与这些国家开展业务。
Feldman 一直对 Nvidia 持批评态度,此前曾指责该公司通过继续为中国制造和销售符合制裁要求的加速器而“武装”中国。但在此问题上,他也认为扩散规则过于严格。他还指出,许多其他科技巨头也持同样看法。
他说:“你知道让我、Nvidia、Oracle、Google、Amazon 和 Microsoft 在某件事上达成一致有多困难。让整个竞争行业的人达成一致更是难上加难,而那项政策并不是一项好政策。”
Feldman 补充道:“我们希望美国的出口,包括技术出口,都掌握在我们盟友手中,同时支持美国企业在这一过程中发展。我们需要合理的防范措施,确保设备不会流入中国或被中国人使用;如果有公司对其设备被中国或其他对手使用视而不见,我们需要真正的惩罚措施。我认为扩散规则未能实现这些目标,我相信我们还可以做得更好。”
Feldman 也承认,美国商务部在制定既保护美国利益又不妨碍美国企业在全球开展业务的贸易政策方面面临较大难题。他表示:“我希望我们能回归到更周全的政策,而不是无政策。”
Feldman 对关税对供应链的影响并不太担心。这部分原因在于 Cerebras 的晚餐盘大小芯片是在 TSMC 制造的,但更关键的是,他指出这些芯片并不依赖中国的组件。
他说:“我认为不确定性和意外情况确实让人头疼,这对每个人的供应链都会造成影响。你采购子组件,从其他厂家购买零件,总有人得弄清楚这些部件究竟是产自墨西哥、马来西亚还是奥斯汀;这需要耗费大量的时间和精力。提前给我们一些预警,至少我们不会像无头苍蝇一样到处乱跑,苦苦琢磨定价该怎么算,”他补充道,并指出这些额外成本最终都会转嫁给最终客户。
对于 Cerebras 来说,较高的组件成本在未来可能会带来问题,因为该公司的商业模式——至少在推理领域——已经依赖客户愿意为其生成过程中速度优势支付溢价。据 Artificial Analysis 测算,Cerebras 运行 Llama 4 Scout 时每秒可处理超过 2,600 个 Token,远远领先于诸如 Fireworks 或 Together.ai 等基于 GPU 的 API 供应商(后者每秒大约只能处理 130 个 Token)。但虽说速度比竞争对手快数倍,其价格也处于高端水平。
尽管如此,许多人愿意为此买单,正如我们周二看到 IBM 与 Cerebras 形成合作一样。Big Blue 的 Watson-X AI Gateway 至少部分将运行在 Cerebras 的晶圆级加速器上。
不过,在你过于兴奋之前,需要指出的是,IBM 并没有部署 Cerebras CS-3 集群。该合作协议与 IBM 与 Hugging Face 的合作十分相似,即 IBM 提供通用的 API 接口和计费平台,而实际的推理工作负载则在 Cerebras 数据中心运行。
就在一周前,Cerebras 又取得了另一项胜利,当时 Meta 确认其新 Llama API 服务中至少一部分也将基于 Cerebras 的硬件运行。
这些胜利有助于该公司实现客户群的多元化。直到最近,Cerebras 极度依赖总部位于阿联酋的 AI 云服务提供商 G42,该公司在 2024 年上半年贡献了其 87% 的收入。
阿联酋是中东多个国家之一,在这些国家中,美国设计的 AI 加速器出货仍受到严格限制。G42 通过资助在美国建设几台 Cerebras AI 超级计算机,从而规避了许多这类挑战。
尽管有谣传称特朗普政府可能会放宽对阿联酋 AI 加速器的限制,但除非特朗普政府彻底取消这些限制,否则阿联酋在计算能力方面仍将受到 AI 扩散规则的约束。这可能也是 G42 据称已设立美国分部的原因之一。
好文章,需要你的鼓励
铠侠正在测试最新的UFS v4.1嵌入式闪存芯片,专为智能手机和平板电脑设计,可提供更快的下载速度和更流畅的设备端AI应用性能。该芯片采用218层TLC 3D NAND技术,提供256GB、512GB和1TB容量选择。相比v4.0产品,随机写入性能提升约30%,随机读取性能提升35-45%,同时功耗效率改善15-20%。新标准还增加了主机发起碎片整理、增强异常处理等功能特性。
上海AI实验室团队提出创新的异步拍摄方案,仅用普通相机就能实现高速4D重建。该方法通过错开相机启动时间将有效帧率从25FPS提升至100-200FPS,并结合视频扩散模型修复稀疏视角导致的重建伪影。实验结果显示,新方法在处理快速运动场景时显著优于现有技术,为低成本高质量4D内容创作开辟新路径。
谷歌在伦敦云峰会上发布Firebase Studio更新,新增Gemini命令行界面集成、模型上下文协议支持和"代理模式"。代理模式提供三种AI协作层次:对话式"询问"模式用于头脑风暴,人机协作代理需开发者确认代码变更,以及几乎完全自主的代理模式。尽管谷歌声称已有数百万应用使用该平台,但目前仍需精心设计提示词,非工程师用户还无法直接创建成熟应用。
上海AI实验室联手复旦大学提出了POLAR方法,这是一种革命性的奖励模型训练技术。通过让AI学会识别不同策略间的差异而非死记评分标准,POLAR在多项任务上实现了显著提升,7B参数模型超越72B现有最强基线,为AI对齐问题提供了全新解决思路。