在AI领域,所有目光都聚焦在GPU上,这从英伟达令人震惊的4万亿美元市值就可以看出。然而,所有的AI训练和推理处理不仅仅需要GPU,还需要GPU之间的网络连接、为GPU供电和散热的基础设施,最重要的是,需要存储和内存来管理所有原始数据和模型。正如数学家克莱夫·亨比所说,"数据是新石油"。它驱动着世界经济,是AI的核心。没有数据,就没有AI。因此,存储和内存子系统(有时被称为AI数据层或AI数据管道)是系统最关键的组成部分之一。另一家美国公司美光科技正在迅速崛起,成为这一关键AI数据层的重要供应商。
披露声明:我的公司Tirias Research曾为AMD、英伟达、美光和本文提到的其他公司提供咨询服务。
AI数据层
服务器的内存和存储层次结构非常复杂,经过数十年的发展演进。为了跟上处理元件的性能以及日益复杂的工作负载(如AI)的需求,对提高内存性能和密度的持续需求推动了层次结构各个层面的创新。创新涵盖了从片上SRAM到紧密耦合的高带宽内存(HBM),再到系统主内存、池化内存资源以及SSD存储。对于AI工作负载而言,内存和存储已成为处理AI工作负载中关键的、非商品化的元素。只有三家主要供应商能够提供这两个主要组件:美光、三星和SK海力士,其中只有美光是美国公司。
美光的数据中心加速发展
虽然美光在消费级和嵌入式/物联网应用领域也占有重要地位,但其在数据中心的成功与AI的增长密切相关,特别是在高性能HBM内存和SSD存储方面。美光最初专注于一种名为混合内存立方体(HMC)的替代内存技术,并在大约七年前转向HBM。该公司在HBM2和HBM2E方面的初期挑战使其落后于竞争对手。然而,美光利用英伟达Hopper一代AI GPU加速器的突破性增长,通过HBM3和HBM3E代产品在不到一年的时间里夺得了第二名的位置,并且在AMD和英伟达的下一代AI GPU加速器方面似乎处于领先地位。美光的HBM3E被集成到AMD最新的Instinct MI350平台中,据报道,该公司已在向重要客户出货HBM4,用于未来的AI平台。
利用公司专有的1-beta制程节点用于HBM3E和HBM4代产品,结合先进的中介层和芯片堆叠技术,美光的HBM产品提供业界最高带宽,性能效率比三星和SK海力士的产品高出30%。与美光在移动和计算领域与其他重要客户合作的方式类似,该公司与包括AMD和英伟达在内的AI加速器客户密切合作,确保最佳性能、质量和可制造性,从而赢得了下一代高性能AI平台领先内存供应商的地位。
除了投资新的内存和存储架构外,美光还制定了2000亿美元的制造扩张计划,包括在爱达荷州、弗吉尼亚州和日本扩建设施,以及在纽约建设新的晶圆厂综合体。这一扩张不仅将满足AI客户的需求,还将支持美国的本土制造推进计划。
总结思考
虽然内存和存储通常被归类为两个不同的细分市场,但它们形成了一个单一的子系统或数据层。这个数据层对于满足AI工作负载的性能和可扩展性要求至关重要。AI的需求如此之高,以至于数据层必须与处理层协同设计,以确保最佳性能。因此,在数据中心AI方面,内存和存储不是可以轻易被低成本替代品替换的商品。数据层是整个AI平台和AI数据中心的独特组成部分。
美光通过其高性能HBM、DRAM和SSD的组合提供完整的AI数据层解决方案。此外,美光已经证明它拥有在很短时间内成为该领域领导者的技术和资源,这使其对整个电子生态系统以及美国政府的本土化愿景都具有重要价值。
Q&A
Q1:什么是AI数据层?它在AI系统中的作用是什么?
A:AI数据层是指存储和内存子系统,有时也被称为AI数据管道。它是AI系统最关键的组成部分之一,负责管理所有原始数据和模型。由于数据是AI的核心,没有数据就没有AI,因此AI数据层对于满足AI工作负载的性能和可扩展性要求至关重要。
Q2:美光科技在AI内存市场的竞争优势是什么?
A:美光利用专有的1-beta制程节点和先进的中介层、芯片堆叠技术,其HBM产品提供业界最高带宽,性能效率比三星和SK海力士高出30%。美光与AMD、英伟达等AI加速器客户密切合作,确保最佳性能和质量,已成为下一代高性能AI平台的领先内存供应商。
Q3:美光科技的制造扩张计划包括哪些内容?
A:美光制定了2000亿美元的制造扩张计划,包括在爱达荷州、弗吉尼亚州和日本扩建现有设施,以及在纽约建设新的晶圆厂综合体。这一扩张不仅将满足AI客户日益增长的需求,还将支持美国政府推进的本土制造计划。
好文章,需要你的鼓励
本文探讨了AI发展的未来趋势,详细分析了六条有望实现通用人工智能(AGI)的技术路径。随着生成式AI和大语言模型面临发展瓶颈,业界开始将目光转向其他AI发展方向。这六条路径包括神经符号AI、神经形态AI、具身AI、多智能体AI、以人为中心的AI和量子AI。每种路径都有其独特优势和挑战,可能单独或组合推动AI进入下一个发展阶段,最终实现与人类智能相当的AGI系统。
约翰霍普金斯大学研究团队发现VAR模型的马尔可夫变体本质上是离散扩散模型,提出SRDD方法。通过应用扩散模型技术如分类器自由引导、令牌重采样等,SRDD相比VAR在图像质量上提升15-20%,同时具备更好的零样本性能。这项研究架起了自回归模型与扩散模型的理论桥梁,为视觉生成技术发展开启新方向。
培生公司第三季度销售增长加速,并预示年底表现更强劲,但其AI应用可能是更重要的发展。该公司虚拟学习部门销售额激增17%,学生注册人数攀升。培生运营的在线学校将AI工具嵌入课程材料中,公司表示有越来越多证据显示这些工具帮助学生取得更好成绩。公司推出了AI学习内容组合,包括AI素养模块和融合人工导师与AI学习工具的视频平台。
微软亚洲研究院推出CAD-Tokenizer技术,首次实现AI通过自然语言指令进行3D模型设计和编辑的统一处理。该技术通过专门的CAD分词器和原语级理解机制,让AI能像设计师一样理解设计逻辑,大幅提升了设计精度和效率,有望推动工业设计的民主化进程。