“我们芯片单拿出来一部分都比你们整个芯片还要好”。这个观点一出现,整个硅谷的目光都投向了SambaNova的CEO Rodrigo Liang。SambaNova是一个快速成长的独角兽公司,SambaNova已经收到来自谷歌和后续的英特尔的巨额投资。还有其他参与的投资企业包括SoftBank, Temasek, and Walden International。SambaNova在 D轮融资中获得6.76亿美元,使其估值达到51亿美元。这些产业顶级大亨的出手使得整个业界意识到GPU更新换代的战争已经开始了。面对物联网、AI大潮奔涌而来,数据洪流和复杂场景所带来的变化反复冲击现有芯片产业发展格局,不得不让芯片领导者们重新思考应对之策。
通用性芯片和专用性芯片,到底谁才是AI时代的“关键钥匙”?
小孩子才做选择,而英特尔选择全都要!
与大多数芯片企业各有侧重点不同,经过多年的行业深耕、技术沉淀和创新引领,英特尔认为AI计算的场景广阔,计算方式多变,这无疑将对现有计算形式提出颠覆性的新挑战。所以,英特尔致力于通过一系列跨计算的CPU、FPGA、GPU、VPU以及专用的AI加速器来为人工智能提供技术基础,把人工智能注入到我们所打造的所有产品当中。英特尔不仅拥有云、AI、大数据、5G等多种服务,同时也在发展未来AI芯片技术路线上也采取了通用性和专用性并举的“双擎”战略。
英特尔正打造AI通用性技术矩阵
在过去的3年里,伴随着游戏行业、自动驾驶的春风,GPU在相对集中的AI图形渲染、AI可视化应用场景中的价值得到显现,NVIDIA也水涨船高成为了以GPU为核心技术路线的头部AI芯片厂商,这从客观上充分说明了,芯片对于AI产业发展的重中之重的位置。
不过即便如此,GPU的应用还是相对有限,而AI产业的发展路线是广阔的,随着5G、智慧城市、万物互联概念的延展,仅依靠专用芯片、专门场景是不足以解决全部问题的。正是基于这层思考,近年来英特尔在已有CPU技术积累的基础上大力发展GPU、IPU、oneAPI平台、Foveros 3D堆叠等等创新技术,甚至能用开放的心态与台积电达成代工合作。这背后皆因为英特尔不满足于仅提供通用性芯片,英特尔希望做的是面向未来,依靠芯片和软件技术形成AI技术矩阵,形成平台化的综合解决方案库,为5G、AI、云、大数据、智慧城市、万物互联提供全方位的综合解决方案。
英特尔Ponte Vecchio SoC
就在刚刚过去的8月19日英特尔架构日上,英特尔公司高级副总裁兼加速计算系统和图形事业部总经理Raja Koduri携手多位英特尔架构师,全面介绍了英特尔重大技术架构的改变和创新,包括两种全新x86内核架构的详情;英特尔首个性能混合架构,代号“Alder Lake”,以及智能的英特尔硬件线程调度器;专为数据中心设计的下一代英特尔至强可扩展处理器Sapphire Rapids;基础设施处理器(IPU);即将推出的显卡架构,包括 Xe HPG 微架构和 Xe HPC 微架构,以及 Alchemist SoC, Ponte Vecchio SoC,这就同时囊括了CPU、GPU和IPU在内的多种技术产品。
其中基于Xe HPC微架构的Ponte Vecchio被冠以迄今为止最复杂的SoC的头衔。它拥有1000亿颗晶体管,47个单元(Tiles),且各个单元可能基于英特尔或台积电不同晶圆制造厂不同工艺生产制造,并通过英特尔Foveros 3D技术封装在一起。能够提供领先业界的每秒浮点云算能力和计算密度。正如Raja Koduri,在英特尔架构日上所表达的那样,这些新架构将为即将推出的高性能产品注入动力,并为英特尔的下一个创新时代奠定基础,以满足世界对高计算能力日益增长的需求。
边缘计算场景让专用性芯片创新多维发展
AI所代表的是我们未来的生活方式,未来的商业、未来的医疗、未来的智能城市。可以想象未来AI所演化出来的场景将会非常非常复杂和多样。如果说AI通用性技术和解决方案平台搭建依然是巨头们所主导和引领的,那么位于AI场景中那些或者高效并发,或者细分领域的边缘计算场景则给了其他芯片厂商和广大初创企业们以巨大机会。因为不可能所有通用芯片产品都能做到全面且高效,所有总要有针对边缘计算场景突出重围的佼佼者。
在这个万物互联的AI时代,爆发式的各类海量数据对于以网络、云计算、数据中心为基础的传统架构并不友好,围绕数据采集、数据传输、数据分析、数据返回执行链条上回额外消耗更多的时间,导致不必要的运算延迟。所以在许多边缘计算的AI细分场景中,针对“存储优先”这一思路所做的架构设计模式是一个相当不错的创新方向。
SambaNova,初创AI企业中的佼佼者,独角兽。由于看到了可重构数据流的处理系统这一发展趋势,SambaNova基于内存可重构数据流技术做出的芯片在基准测试中甚至获得了比NVIDIA A100更好的表现。再比如加拿大初创公司Untether AI,通过电子内存计算技术,研发出能提高移动数据传输速度1000倍的全新芯片架构。国内的探境科技,也早在2019年就开展了存储优先架构的设计研发,芯片应用于自动驾驶领域可在识别距离、响应时间、能耗水平等多方面获得明显优势。可以说在专用性芯片领域,中国创新同样站在世界前沿。
为了能够更好的掌握架构创新路线轨迹,把握这个高度离散的专用芯片创新研发脉搏,英特尔近几年来不断加大对于AI领域的投资和投入,几年前英特尔为了快速切入自动驾驶领域,收购了mobileye,去年英特尔斥资20亿美元收购Habana Lab,用直接购买的方式快速迭代了自家的Nervana,就是为了细分领域抢发展先机。而上文提到过的SambaNova、Untether AI也都无一例外收到来自英特尔的投资。作为AI行业深耕多年的领袖,英特尔在专用芯片创新的布局上深入且广泛。
小结
毫无疑问,对于英特尔来说,在现有的AI发展格局上,最好的方式就是采用通用性与专用性结合的“双擎”战略。除了继续保持自身平台化、统一化的解决方案技术矩阵,还能时刻保持对行业的敏锐观察,紧跟随时可能出现的AI热点。过去几年里,不管是消费者还是投资客似乎只关注到了繁荣业绩下更显辉煌夺目的NVIDIA,却忽视了默默深耕的英特尔。捋顺过去几年的发展就不难发现,那个年过半百的半导体巨人,如今依然鲜活。
根据英特尔预测,截至2024年,AI芯片市场的规模将超过250亿美元。人工智能和数据分析是未来10年起决定作用的工作负载,是关键的转折性技术,是和云、5G驱动的连接、智能边缘并列的改变世界的“超级力量”之一。相信在接下来一段时间,英特尔将在AI领域继续保持激进的创新和投资节奏,为下一个创新时代奠定深厚基础。
好文章,需要你的鼓励
Nvidia 在最新的 CUDA 12.8 版本中宣布,Maxwell、Pascal 和 Volta 架构的支持将被冻结。这意味着一系列老旧显卡将逐步失去技术支持。虽然这些设备短期内仍可使用,但未来可能面临兼容性问题。此举将影响依赖这些旧型号的数据中心和科研机构。
随着AI的发展,高密度数据中心中高性能GPU的使用产生了大量热量。液冷成为唯一可行的散热方案,但其部署面临成本和风险concerns。通过分析液冷的必要性、经济效益和简化措施,数据中心团队可以为液冷技术的采用提供有力论据,从而保护高价值、高能耗的GPU机架。
微软推出基于 PostgreSQL 的开源文档数据库平台,并建议用户可以通过实施开源 FerretDB 解决方案来开始使用。这一举措展现了微软对开源世界的日益接受,旨在满足社区对 NoSQL 数据库的需求,同时提供完全开源、无商业许可费用的解决方案。
Commvault 与 CrowdStrike 达成战略合作,将 Falcon XDR 集成至 Commvault Cloud,以提升客户的网络威胁检测和响应能力。这一合作旨在加强数据保护、提高网络弹性,使企业能更快速地识别威胁、响应攻击,并有效降低网络安全风险。