为了"重新定义高性能计算的可能性",处理器巨头AMD宣布与HPE扩大合作,加速开发下一代开放式、可扩展的人工智能基础设施,该基础设施将基于AMD领先的计算技术构建。
合作的核心内容是HPE将成为首批采用AMD Helios机架级AI架构的系统供应商之一。该架构将整合专门构建的HPE Juniper网络扩展交换机(与Broadcom合作开发)以及软件,通过以太网实现无缝、高带宽连接。
Helios平台整合了AMD EPYC中央处理器、AMD Instinct图形处理器、AMD Pensando先进网络技术和AMD ROCm开放软件栈,旨在提供一个在性能、效率和可扩展性方面优化的统一平台。AMD表示,该系统能够简化大规模AI集群的部署,实现更快的解决方案交付和更大的基础设施灵活性,适用于研究、云计算和企业环境。
基于OCP开放机架宽设计,Helios旨在帮助客户和合作伙伴简化部署时间表,为要求苛刻的AI工作负载提供可扩展、灵活的解决方案。Helios机架级AI平台使用AMD Instinct MI455X GPU、AMD EPYC Venice CPU和AMD Pensando Vulcano网络接口卡,每个机架可提供高达2.9千万亿次浮点运算的FP4性能。整个系统通过开放的ROCm软件生态系统统一,AMD声称这将为AI和高性能计算工作负载带来灵活性和创新。
AMD董事长兼CEO苏姿丰表示:"HPE一直是AMD的杰出长期合作伙伴。通过Helios,我们将这种合作推向更深层次,将AMD全栈计算技术与HPE的系统创新相结合,为客户提供开放的机架级AI平台,在AI时代推动效率、可扩展性和突破性性能的新水平。"
HPE表示,此次合作使其能够为客户集成差异化技术,特别是为Helios设计的扩展以太网交换机和软件。该交换机与Broadcom合作开发,使用超级加速器链路以太网标准,为AI工作负载提供优化性能,强化了AMD对开放、基于标准技术的承诺。
HPE总裁兼CEO安东尼奥·内里表示:"十多年来,HPE和AMD一直在推动超级计算的边界,交付多个百万亿次级系统,并推动加速创新的开放标准。随着新的AMD Helios和我们专门构建的HPE扩展网络解决方案的推出,我们为云服务提供商客户提供更快的部署、更大的灵活性,并降低其业务中AI计算扩展的风险。"
HPE将于2026年在全球提供AMD Helios AI机架级架构。
HPE还透露,德国斯图加特高性能计算中心的新超级计算机Herder将采用AMD Instinct MI430X GPU和下一代AMD EPYC Venice CPU。
基于HPE Cray超级计算GX5000平台构建,Herder旨在为大规模高性能计算和AI工作负载提供性能和效率。
HPE和AMD相信,他们各自的计算产品组合和系统设计相结合,将为欧洲研究人员和企业的主权科学发现和工业创新创造强大工具。Herder预计将于2027年下半年交付,并计划在2027年底投入使用。
斯图加特高性能计算中心主任迈克尔·雷什表示:"我们的科学用户社区要求我们继续支持传统的数值模拟高性能计算应用。与此同时,我们看到对机器学习和人工智能日益增长的兴趣。Herder的系统架构将使我们能够同时支持这两种方法,同时为用户提供开发和受益于新型混合高性能计算/AI工作流程的能力。这个平台不仅能让我们的用户运行更大、更强大的模拟实验,从而带来令人兴奋的科学发现,还能开发出更高效的计算方法,这些方法只有在下一代硬件提供的能力下才可行。"
Q&A
Q1:AMD Helios架构有什么特点?
A:Helios是AMD推出的机架级AI架构,整合了AMD EPYC CPU、AMD Instinct GPU、AMD Pensando网络技术和ROCm开放软件栈。每个机架可提供高达2.9千万亿次浮点运算的FP4性能,旨在简化大规模AI集群部署,提供更快的解决方案交付和更大的基础设施灵活性。
Q2:HPE与AMD的这次合作什么时候能够投入使用?
A:HPE将于2026年在全球提供AMD Helios AI机架级架构。同时,基于该技术的德国斯图加特高性能计算中心超级计算机Herder预计将于2027年下半年交付,并计划在2027年底投入使用。
Q3:这种机架级AI架构主要用于什么场景?
A:该架构主要适用于研究、云计算和企业环境中要求苛刻的AI工作负载。特别是为云服务提供商客户提供更快的部署、更大的灵活性,并能同时支持传统的高性能计算应用和新兴的机器学习、人工智能应用。
好文章,需要你的鼓励
芬兰阿尔托大学研究团队开发出革命性光学计算方法,利用单束光线实现复杂张量运算。该技术将数字信息编码到光波的振幅和相位中,通过光波相互作用自动完成深度学习所需的矩阵和张量乘法运算。与传统GPU逐步处理不同,光学系统可同时并行执行所有计算操作,运算速度达到光速级别。研究显示该方法具有被动处理、低功耗等优势,预计3-5年内可集成到现有硬件平台,为AI计算带来重大突破。
新加坡科技设计大学研究团队发现,通过控制大型语言模型的"思考语言"可显著提升输出多样性。研究显示,AI用非英语语言思考时能产生更多样化的答案,且距离英语越远的语言效果越好。混合多种语言思考的策略表现最佳,不仅提升创意输出,还增强了文化多元化表达能力,为解决AI输出同质化问题提供了简单有效的方案。
科学家成功将传统公里级粒子加速器缩小至房间大小,并实现商业化。TAU Systems公司开发的激光驱动尾场加速器利用超强激光脉冲产生等离子体,将电子加速至相对论速度。该设备首先用于航天电子设备的辐射测试,能量范围60-100兆电子伏特,成本约1000万美元起。未来还可应用于医疗成像、芯片检测和X射线光刻等领域,有望大幅降低粒子加速器的使用门槛。
浙江大学研究团队开发了PhyRPR三阶段视频生成系统,解决AI视频中物理规律违背问题。该方法将物理理解与视觉生成分离处理:首先用大型语言模型进行物理推理和关键帧生成,然后规划连续运动轨迹,最后通过运动感知技术精化视觉效果。实验证明该方法在物理一致性和视觉质量方面均优于现有技术。