英特尔希望其最新芯片能够解决AI相关的能效和成本问题,即使竞争对手AMD和英伟达正在提高功耗以实现更高性能。
该公司周一推出了旗舰级Xeon 6+ CPU、名为Crescent Island的新GPU以及新型以太网控制器。
这是自去年3月Lip-Bu Tan担任CEO以来首次发布的重要数据中心产品。
英特尔曾是芯片创新的代名词,如今正在转变理念,帮助客户在成本和性能之间实现系统平衡,而不是单纯销售最强大的芯片。Xeon产品线总监Kira Boyko表示:"我们的客户不断告诉我们,这变得太昂贵且消耗太多能源。因此,我们从产品设计之初就考虑全局视角。"
Hyperframe Research常驻分析师Stephen Sopko表示,英特尔的新产品应该能够实现显著的服务器整合,降低机房空间需求,同时提高吞吐量。"爆炸式增长的AI创造了电力、冷却和运营成本方面的重大限制。"
Crescent Island GPU专为智能体设计
英特尔宣布推出代号为Crescent Island的新GPU Xe3P。英特尔数据中心集团AI产品副总裁Anil Nanduri表示:"它是专为即将到来的智能体AI时代而设计的。我们专注于数据中心的成本高效推理。"
智能体AI工作负载涉及人类生成数十万个智能体,这款350瓦的Crescent Island GPU可以运行多个专家智能体,协调CPU或其他加速器之间的操作。
"没有传统的图形或3D支持。事实上,移除这些功能使我们能够提供更多面积和硅片来提高AI性能,"Nanduri说。
英特尔选择了480GB的LPDDR5X内存——通常用于PC和智能手机——因其低成本和高能效。"我们做出了非常慎重的设计选择,使用LPDDR内存而不是GDDR:具有密集封装通道的LPDDR5X内存提供显著的带宽,最重要的是内存容量。"
内存供应限制推高了内存和GPU价格。上月Trendforce报告称LPDDR5X需求正在收紧产能。Nanduri表示,这种内存类型可以接触"不同的内存合作伙伴"以保持供应。
英伟达和AMD在其最快的GPU中采用另一种图形内存类型HBM(高带宽内存)。根据Counterpoint Research研究,HBM主要由SK海力士、三星和美光三家供应商提供,占据95%的市场份额。Trendforce报告还指出,由于短缺,HBM在2027年将面临100%的价格上涨。
Nanduri表示,Crescent Island的发货日期将稍后公布。
Xeon 6+采用18A制程工艺
英特尔还宣布推出代号为Clearwater Forest的Xeon 6+,该产品从去年延期至今。这是英特尔18A制造工艺上的首款芯片,新的晶体管特性使其更快、更节能。
Boyko表示,作为芯片,CPU已从GPU的阴影中重新崛起,因为它处理AI智能体并在加速器之间分配工作负载。"我们实际上看到大量GPU利用率很低,因为它们没有CPU来支持它们并帮助进行工作负载的编排。"
Xeon 6+提供288个低功耗E核心,最高8000兆传输每秒的DDR5内存和576兆字节的末级缓存。
Boyko表示,在最近的领导层变动和AI对计算需求的影响下,Clearwater Forest进行了许多设计变更。例如,Xeon 6+最初设计支持7200兆传输每秒,但客户希望更快的带宽来处理AI编排和智能体。
Xeon 6+包含AET(应用能源遥测)功能,这是一项新特性,为运营商提供应用级能源使用的实时可见性。这允许更好地编排和调整工作负载。
它还让数据中心提供商能够根据实际能源使用而非估算值准确向客户计费。这允许准确的费用回收,或让运营商提供回扣,"激励最终客户以不同方式编排或使用能源,从而降低总体成本。"
英特尔表示,主要OEM厂商将在6月宣布Xeon 6+服务器。由于插槽兼容性,服务器制造商还将把新芯片插入运行Xeon 6 CPU的系统中。
E835以太网卡强调安全与能效
英特尔还推出了E835以太网卡。虽然200Gbps的速度并非最快(网卡已达到400Gbps),但英特尔强调了其安全功能和能效。
英特尔以太网产品线高级总监Brian Neipoky在媒体发布会上表示,在全200Gbps双向负载下,E835的功耗比英伟达ConnectX6低47%,比博通BCM957508-P2100G低28%。
J. Gold Associates首席分析师Jack Gold表示,随着AI Token计费飙升和Token生成的高功耗,英特尔的策略很好。
监控功耗和成本可以降低数据中心成本,还能预测故障并延长芯片生命周期。"与高温一样,高功耗通常对芯片寿命不利。"
但挑战依然存在。Gold表示,英特尔没有连接其PC、数据中心和边缘市场的连贯AI策略。过去几年,在前CEO Pat Gelsinger领导下取消多款GPU产品后,英特尔已将GPU市场让给英伟达。
但它也需要在CPU领域重新夺回失地。超大规模云服务商谷歌、亚马逊、Meta和微软已开发出自己的基于ARM的CPU,而AMD在x86市场的份额也在增长。
"问题是,随着其他主要基于ARM的厂商试图占领市场份额,x86是否仍将是该领域的主导者?"Gold说。
Q&A
Q1:英特尔Crescent Island GPU有什么特别之处?
A:Crescent Island是专为智能体AI时代设计的GPU,功耗为350瓦,可运行多个专家智能体并协调CPU或其他加速器之间的操作。它移除了传统图形和3D支持功能,将更多硅片面积用于提升AI性能。该GPU采用480GB的LPDDR5X内存,而非传统的GDDR或HBM内存,以实现低成本和高能效。
Q2:英特尔Xeon 6+ CPU有哪些创新功能?
A:Xeon 6+是英特尔18A制造工艺上的首款芯片,提供288个低功耗E核心和最高8000兆传输每秒的DDR5内存。它包含AET(应用能源遥测)新功能,可提供应用级能源使用的实时可见性,帮助运营商更好地编排工作负载,并根据实际能源使用向客户准确计费。该芯片将于6月由主要OEM厂商发布。
Q3:英特尔为什么强调能效而不是性能?
A:英特尔客户不断反馈AI相关成本过高且能耗过大。爆炸式增长的AI创造了电力、冷却和运营成本方面的重大限制。英特尔转变策略,从产品设计之初就考虑帮助客户在成本和性能之间实现平衡,而不是单纯追求最强大的芯片。监控功耗和成本不仅能降低数据中心成本,还能预测故障并延长芯片生命周期。
好文章,需要你的鼓励
一名特斯拉车主Ben Gawiser于2021年花费1万美元购买FSD(完全自动驾驶)软件,但五年过去,该软件始终未能实现当初承诺的L5级自动驾驶能力。他向德克萨斯州小额索赔法院提起诉讼,特斯拉未予回应,法院判决其获赔10,672美元。特斯拉多次拖延支付,最终在法院拒绝其重审请求后,于5月底向Gawiser寄出了10,800美元支票。目前全球多地已出现相关集体诉讼。
本文介绍了VinUniversity与UIUC联合发现的大型推理模型隐藏自我修正现象,并揭示了可用于无训练增强AI错误检测能力的批评向量提取方法。
人工智能正迫使企业重新审视业务连续性策略,从传统的冗余容灾模式转向"架构独立性"理念。随着AI深度嵌入企业运营,一旦AI服务中断,损失的不仅是算力,更是驱动物流、欺诈检测和客户体验的决策系统。全球2000强企业每年因停机损失约4000亿美元,平均每小时损失54万美元。IT领导者需将AI纳入业务连续性风险管理,同时借助AI实现预测性运维与自愈能力。
弗莱堡大学等机构提出CRONOS基准,系统测试AI视频模型在视角、场景等视觉条件变化下的物理预测一致性,揭示当前最强开源模型成功率仅22%的严峻现状。