在半导体行业的一项令人瞩目的成就中,AMD宣布已超越其雄心勃勃的30x25能效目标,加速推进AI和高性能计算系统的绿色倡议。这一始于2020年的大胆目标旨在五年内将能效提升30倍,最终实现了令人瞩目的38倍改进——而且还提前完成了目标。随着行业面临AI工作负载日益增长的需求,AMD的最新成就不仅彰显了公司的技术实力,更体现了其在加速计算领域推动可持续解决方案的承诺。
AMD的能效整体策略
在与AMD首席技术官Mark Papermaster的简短交流中,我深入了解了公司如何为AI数据中心实现更绿色的环保足迹。Papermaster将公司的成功归功于芯片设计和系统架构的全面整体方法。"能效不是来自技术的单一方面,"Papermaster在我们的会议中解释道,"这不仅仅关乎硅片、芯粒,甚至软件。而是所有这些元素的结合——架构、设计、封装、软件,甚至数据中心基础设施——共同实现真正的规模化效率。"
这种集成方法在AMD MI300加速器的设计中得到了充分体现,在3D堆叠和芯片互连方面实现了关键进展。特别是后者,在提升GPU性能功耗比指标方面发挥了关键作用。正如Papermaster强调的,"当你垂直堆叠芯片时,与传统的横向设计方法相比,能效可以提升多达20倍。"
展望未来,AMD下一代芯片——昨天刚刚发布的AMD MI350系列——有望进一步突破极限。这些采用3nm GPU芯粒和新矩阵数学格式的尖端芯片,预计在上一代基础上将能效再提升35倍,使AMD能够更好地与英伟达最强大的Blackwell GPU和系统竞争。
超越AMD的30x25目标并设定标杆
尽管如此,虽然38倍能效提升是一个里程碑,但这并不是AMD的终点。正如AMD高级副总裁Samuel Naffziger在最近的公司发布中分享的,AMD已经将注意力转向下一个雄心勃勃的目标:到2030年实现机架级能效20倍改进。"到2030年实现机架级20倍目标反映了下一个前沿,不仅专注于芯片,还包括更智能、更高效的系统,从硅片到完整机架集成,以解决数据中心级别的电力需求,"Naffziger解释道。AMD已经证明节点级效率提升可以带来变革,但随着AI工作负载的扩展,最重要的影响将在系统层面。到2030年,AMD旨在为整个AI系统机架实现20倍能效改进。
此外,Papermaster解释说,这些效率目标是"AMD收购ZT Systems的动机之一,这样AMD现在拥有1000名机架设计工程师来帮助我们优化,最小化连接长度,尽可能提供能效提升点。"
这一以2024年为基准设定的新目标,标志着AMD对AI能效看法的重大转变。公司不再纯粹关注单个芯片性能,而是着眼于完整系统优化——从CPU和GPU到网络、内存和存储。这是另一个崇高目标,但在谷歌、AWS和Azure等超大规模服务商积极探索核电站为其饥渴数据中心供电的时代,这也是地球的必要目标。
对AI生态系统的影响及超越硬件的范围
这一到2030年实现20倍改进的新目标潜在影响巨大。根据AMD的预测,这一飞跃可以将典型AI机架的运营用电量减少95%以上,并将模型训练的碳排放从约3000公吨二氧化碳削减至仅100公吨。这些改进还承诺在运营效率方面实现巨大提升,有可能将275个机架整合为仅一个充分利用的机架。
此外,AMD的20x30愿景不仅限于硬件。虽然其能效目标主要关注硅片和系统设计,但公司承认软件也将发挥重要作用。随着软件开发者继续通过更高效的算法和更低精度、量化方法进行创新,到2030年整体AI效率可能提升多达100倍。
对AMD而言,这将通过与更广泛生态系统的合作新机遇来推动。通过其开源软件倡议,如ROCm(Radeon开放计算平台)软件栈,以及与OpenAI等AI创新者的密切合作,AMD正致力于将自己定位为可持续AI解决方案的关键推动者。
可持续性、效率和TCO优势的统一
随着AMD凭借30x25倡议的成功结束一个章节,公司已经为下一个重大效率挑战搭建舞台。将目标锁定在到2030年实现机架级20倍改进的目标上,公司正试图突破AI能效可能性的极限。"也要考虑总拥有成本方程。这关乎产品收费多少以及占用多少机房空间。还有功耗是多少?因为我必须为电力付费。这些都是TCO的要素。所以这种能效直接影响我们所有客户的购买考虑,"Papermaster指出。
无论如何,在这个AI加速一切的新时代,每一瓦特都至关重要,AMD显然致力于同时推动性能和能效。这些努力和目标可能有助于塑造行业如何负责任和可持续地扩展AI的未来。
好文章,需要你的鼓励
SAP S/4HANA内存ERP系统推出十多年后,95%的传统用户表示构建积极的迁移案例需要巨大努力或面临真正挑战。一项涵盖455名CIO、高级IT角色、SAP专家和业务经理的调查发现,83%的受访者不完全理解SAP最新的迁移政策和截止日期,84%对当前信息传递及其对运营的影响表示担忧。SAP为传统ECC系统设定了激进的支持截止日期,主流支持将于2027年结束。
北京大学团队开发出WoW世界模型,这是首个真正理解物理规律的AI系统。通过200万机器人互动数据训练,WoW不仅能生成逼真视频,更能理解重力、碰撞等物理定律。其创新的SOPHIA框架让AI具备自我纠错能力,在物理理解测试中达到80.16%准确率。该技术将推动智能机器人、视频制作等领域发展,为通用人工智能奠定重要基础。
微软通过其Planetary Computer平台将NASA的Landsat和Sentinel-2卫星数据集引入Azure云服务。该数据集包含来自NASA的Landsat 8、9号卫星以及欧洲航天局Sentinel-2系列卫星的地球监测数据,为气候变化、土地利用、农业应用等研究提供宝贵资源。用户可通过API或Azure存储直接访问这些PB级全球环境数据。微软还建议研究人员使用Azure OpenAI服务创建智能应用,结合AI技术进行土地分类、植被监测、森林砍伐趋势分析等地球观测研究。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。