英特尔发布7nm AI芯片，以A100性能的两倍领跑行业

基于此，在近日举办的英特尔On产业创新峰会（Intel Vision）上，英特尔公司旗下的Habana Labs正式发布用于深度学习训练的第二代Gaudi(R)处理器

未来世界，万物皆为“计算机”。在人工智能、无所不在的计算、无处不在的连接、以及从云到边缘的基础设施这四股力量的推动之下，数字技术正在加速整个世界的转型。这四股“超级技术力量”相互交织，相辅相成地放大着自身及其合力的影响，并共同重塑着我们生活和工作的方方面面。基于此，英特尔致力于以数据为中心，同时依托智能创新的引擎和加速器—人工智能，为数字化未来打造坚实的基础设施。

英特尔公司执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示，“预计到2026年，英特尔人工智能逻辑芯片的市场规模将超过400亿美元。我们正以强大的实力抓住这个机会，我对未来充满信心。”

现阶段人工智能已经在深刻变革各行各业，未来它也有望改善地球上每个人的生活，但前提是它能够被更容易地大规模部署。基于此，在近日举办的英特尔On产业创新峰会（Intel Vision）上，英特尔公司旗下的Habana Labs正式发布用于深度学习训练的第二代Gaudi®处理器——Gaudi®2，以及即将上市的用于深度学习推理的Goya™处理器的后续产品---Greco。两款产品采用7纳米制程工艺，基于Synapse AI软件栈开发，以Habana的高能效架构为基础，面向数据中心的计算机视觉和自然语言应用，旨在通过支持多样化架构，让终端用户充分利用处理器的高性能和高能效，为其模型训练和推理提供更高的性能。值得注意的是，与当前市面上基于A100的计算机视觉和NPL产品相比，Gaudi2的AI训练性能提高了两倍。

基于与第一代Gaudi相同的体系架构，Habana Gaudi2处理器大幅提高了训练性能。客户在云端运行Amazon EC2 DL1实例以及本地运行Supermicro Gaudi训练服务器时，其性价比比现有GPU解决方案提升了40%。这也得益于从第一代Gaudi到Gaudi2的架构提升，具体主要体现在：制程工艺从16纳米跃升至7纳米；在矩阵乘法（MME）和Tensor处理器核心计算引擎中引入了含FP8在内的新数据类型；Tensor处理器的核心数量由8个增至24个；芯片上集成多媒体处理引擎，实现从主机子系统的卸载；片内封装的内存容量提升了3倍，从32GB提升到带宽2.45TB/秒的96GB HBM2E；集成两倍48MB的板载SRAM存储器；将基于 RDMA (RoCE2) 的集成以太网从10个增至24个，在标准网络上实现高效的纵向和横向扩展。

英特尔发布7nm AI芯片，以A100性能的两倍领跑行业

与此同时，英特尔亦在峰会上披露了第四代英特尔®至强®可扩展处理器的最新产品细节。期待已久的代号为Sapphire Rapids的第四代英特尔至强可扩展处理器的初始SKU已于近日开始出货，紧随其后，预计今年还会有更多出货。Sapphire Rapids是迄今为止英特尔功能最丰富的至强处理器，增强了其在人工智能、安全性等几大关键数据中心领域的领导地位。第四代英特尔至强可扩展处理器提供卓越的整体性能，将支持 DDR5、PCIe 5.0 和 CXL 1.1，并凭借全新的集成加速器，通过针对 AI 工作负载的软硬件优化提供高达 30 倍的性能提升。其次，该产品亦具备针对电信网络的新功能，可以为虚拟无线接入网（vRAN）部署，提供高达两倍的容量增益1。此外，内置高带宽内存（HBM）的代号为Sapphire Rapids的英特尔至强处理器将显著提高处理器的可用内存带宽，从而为高性能计算提供超级动力。

基于内置高带宽内存（HBM）的代号为Sapphire Rapids的英特尔至强处理器和代号为Ponte Vecchio的英特尔数据中心显卡，阿贡国家实验室的极光（Aurora）超级计算机能够提供每秒超过两百亿亿次的双精度峰值计算性能，其中英特尔oneAPI亦为开发者提供无缝的系统集成。在峰会主题演讲中，阿贡国家实验室的计算、环境和生命科学实验室主任Rick Stevens，首次展示了极光（Aurora）超级计算机的安装情况，并深入解析它将如何助力解决人类面临的疑难问题，如更准确地预测气候以及发现应对癌症的新疗法，同时让百亿亿次计算（E级）广泛应用于研发和创新活动。

来源：业界供稿

0赞

好文章，需要你的鼓励

英特尔发布7nm AI芯片，以A100性能的两倍领跑行业

来源：业界供稿

2022

05/11

16:23

分享

点赞

稚晖君发布全球最小全身力控人形机器人，上纬启元开启个人机器人时代

2026年软件定价大洗牌：IT领导者必须知道的关键变化

Linux 在 2026 年将势不可挡，但一个开源传奇可能难以为继

CES 2026趋势展望：全球最大科技展五大热门话题预测

人工智能时代为何编程技能比以往更重要

AI颠覆云优先战略：混合计算成为唯一出路

谷歌发布JAX-Privacy 1.0：大规模差分隐私机器学习工具库

谷歌量子AI发布新型优化算法DQI：量子计算优化领域的重大突破

缓解电动汽车里程焦虑：简单AI模型如何预测充电桩可用性

Titans + MIRAS：让AI拥有长期记忆能力

Gemini为STOC 2026大会理论计算机科学家提供自动化反馈

夸克AI眼镜持续升级：首次OTA，支持89种语言翻译

这款古怪的 AI 智能手机可以创建你的数字分身

Hugging Face 首席科学官担忧 AI 正在成为"服务器上的应声虫"

AI 公司效仿 DeepSeek，通过"蒸馏"技术打造低成本模型

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

物理 AI 如何通过嵌入式智能改变行业格局

天翼云CPU实例部署DeepSeek-R1模型最佳实践

Sergey Brin 表示：如果谷歌员工每周工作 60 小时，AGI 指日可待

MWC 2025：英特尔展示基于至强6处理器的基础网络设施

Tencent 发布新 AI 模型，称速度快于 DeepSeek-R1

IBM 发布新的 Granite 3.2 系列模型，实现按需推理能力

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: