Cerebras Systems 的晚餐盘大小芯片目前为 Meta 提供最新 AI 推理产品,同时不久后也将供 IBM 使用,但美国的贸易政策对其全球前景产生了重大影响。
" AI 扩散规则是一项糟糕的政策,"Cerebras 首席执行官 Andrew Feldman 在 IBM 年度 Think 大会开幕前的新闻发布会上表示。
除非特朗普政府介入,否则这些以及其他与 AI 相关的规定将在本月晚些时候生效。这些规定是在前总统 Joe Biden 任期末的最后时刻提出的,旨在限制美国 GPU 和 AI 加速器向美国以外,以及除少数美国盟友之外的国家销售。
该政策的目标之一是防止中国及其他受限国家通过直接从允许购买美国加速器的国家获得产品来规避禁令。
然而,尽管一些 AI 初创公司呼吁对 AI 出口实施更严格的管控,美国芯片公司却对此持反对态度。上周,Nvidia 首席执行官 Jensen Huang——其庞大的 GPU 帝国将因这些规定遭受最大损失——呼吁特朗普政府对规定进行修订。
从本质上来看,扩散规则将实施严格的出口管制,并且除美国认为是盟友的 18 个受青睐国家外,每个国家每年仅能获得少量芯片分配。芯片制造商更希望政府不要具体规定他们可以向谁销售多少产品,因为这会限制他们能触及的总体市场。以往,政府在处理安全问题时通常是将特定国家加入 US Entities 列表,之后供应商便需要获得特殊许可证才能与这些国家开展业务。
Feldman 一直对 Nvidia 持批评态度,此前曾指责该公司通过继续为中国制造和销售符合制裁要求的加速器而“武装”中国。但在此问题上,他也认为扩散规则过于严格。他还指出,许多其他科技巨头也持同样看法。
他说:“你知道让我、Nvidia、Oracle、Google、Amazon 和 Microsoft 在某件事上达成一致有多困难。让整个竞争行业的人达成一致更是难上加难,而那项政策并不是一项好政策。”
Feldman 补充道:“我们希望美国的出口,包括技术出口,都掌握在我们盟友手中,同时支持美国企业在这一过程中发展。我们需要合理的防范措施,确保设备不会流入中国或被中国人使用;如果有公司对其设备被中国或其他对手使用视而不见,我们需要真正的惩罚措施。我认为扩散规则未能实现这些目标,我相信我们还可以做得更好。”
Feldman 也承认,美国商务部在制定既保护美国利益又不妨碍美国企业在全球开展业务的贸易政策方面面临较大难题。他表示:“我希望我们能回归到更周全的政策,而不是无政策。”
Feldman 对关税对供应链的影响并不太担心。这部分原因在于 Cerebras 的晚餐盘大小芯片是在 TSMC 制造的,但更关键的是,他指出这些芯片并不依赖中国的组件。
他说:“我认为不确定性和意外情况确实让人头疼,这对每个人的供应链都会造成影响。你采购子组件,从其他厂家购买零件,总有人得弄清楚这些部件究竟是产自墨西哥、马来西亚还是奥斯汀;这需要耗费大量的时间和精力。提前给我们一些预警,至少我们不会像无头苍蝇一样到处乱跑,苦苦琢磨定价该怎么算,”他补充道,并指出这些额外成本最终都会转嫁给最终客户。
对于 Cerebras 来说,较高的组件成本在未来可能会带来问题,因为该公司的商业模式——至少在推理领域——已经依赖客户愿意为其生成过程中速度优势支付溢价。据 Artificial Analysis 测算,Cerebras 运行 Llama 4 Scout 时每秒可处理超过 2,600 个 Token,远远领先于诸如 Fireworks 或 Together.ai 等基于 GPU 的 API 供应商(后者每秒大约只能处理 130 个 Token)。但虽说速度比竞争对手快数倍,其价格也处于高端水平。
尽管如此,许多人愿意为此买单,正如我们周二看到 IBM 与 Cerebras 形成合作一样。Big Blue 的 Watson-X AI Gateway 至少部分将运行在 Cerebras 的晶圆级加速器上。
不过,在你过于兴奋之前,需要指出的是,IBM 并没有部署 Cerebras CS-3 集群。该合作协议与 IBM 与 Hugging Face 的合作十分相似,即 IBM 提供通用的 API 接口和计费平台,而实际的推理工作负载则在 Cerebras 数据中心运行。
就在一周前,Cerebras 又取得了另一项胜利,当时 Meta 确认其新 Llama API 服务中至少一部分也将基于 Cerebras 的硬件运行。
这些胜利有助于该公司实现客户群的多元化。直到最近,Cerebras 极度依赖总部位于阿联酋的 AI 云服务提供商 G42,该公司在 2024 年上半年贡献了其 87% 的收入。
阿联酋是中东多个国家之一,在这些国家中,美国设计的 AI 加速器出货仍受到严格限制。G42 通过资助在美国建设几台 Cerebras AI 超级计算机,从而规避了许多这类挑战。
尽管有谣传称特朗普政府可能会放宽对阿联酋 AI 加速器的限制,但除非特朗普政府彻底取消这些限制,否则阿联酋在计算能力方面仍将受到 AI 扩散规则的约束。这可能也是 G42 据称已设立美国分部的原因之一。
好文章,需要你的鼓励
这项研究探索了语言神经元视角下多语言对齐如何增强大语言模型(LLMs)的多语言能力。研究团队提出了一种更精细的神经元识别算法,将激活神经元分为语言特定、语言相关和语言无关三类,克服了现有方法的局限性。基于这种分类,研究将LLMs多语言处理过程划分为四个阶段:多语言理解、共享语义空间推理、多语言输出空间转换和词汇空间输出。通过分析对齐前后不同类型神经元的变化,发现多语言对齐促进了更多语言相关神经元的共享使用,减少了对语言特定神经元的依赖,这也解释了"自发多语言对齐"现象。
这项由弗吉尼亚大学与Adobe研究院合作的研究突破了传统图像到视频生成的空间限制,提出了"Frame In-N-Out"技术,使物体可以自然地离开画面或新物体能够进入画面。研究团队创建了专门的数据集和评估方法,并设计了一种融合运动控制、身份参考和无边界画布的扩散变换器架构。实验结果表明,该方法在生成质量和控制精度上显著优于现有技术,为电影制作和创意内容创作提供了新可能。
浙江大学研究团队开发了首个评估视觉语言模型多视角空间定位能力的综合基准ViewSpatial-Bench,并揭示了现有模型在视角转换理解上的严重缺陷。通过自动化3D标注流水线构建的大规模数据集,他们训练出的多视角空间模型(MVSM)实现了46.24%的性能提升,为人机空间交互提供了新的解决方案,使AI系统能更好地理解人类视角下的空间关系,促进更直观的人机交流。
ByteDance团队提出的DetailFlow是一种创新的图像生成方法,通过"下一细节预测"策略实现从粗到细的自回归生成。它将图像编码为仅需128个令牌的1D序列,比传统方法少5倍,却实现了更高质量(2.96 gFID)和更快速度(提速约8倍)。该方法巧妙地模拟人类创作过程:先勾勒整体结构,再逐步添加细节,并通过自我纠错机制解决并行推理中的错误累积问题,为高分辨率图像生成提供了高效解决方案。