高通发布AI加速器并计划部署在神秘机架系统中

高通发布了面向AI数据中心市场的AI200和AI250加速器卡片。AI200支持每卡768GB LPDDR内存，AI250采用近存储计算架构，将在推理工作负载中实现10倍以上的有效内存带宽提升和更低功耗。产品将以预配置机架形式交付，采用直接液冷、PCIe扩展和以太网连接。沙特AI公司Humain已成为首个客户，计划从2026年开始部署200兆瓦的高通AI解决方案。

高通公司宣布了其进军AI数据中心市场的详细计划，发布了一对加速器产品和用于容纳它们的机架级系统，全部专注于推理工作负载。

该公司对其新推出的AI200和AI250"基于芯片的加速器卡"提供的技术细节有限，仅表示AI200每卡支持768GB的LPDDR内存，而AI250将提供"基于近内存计算的创新内存架构"，代表"AI推理工作负载在效率和性能方面的代际飞跃，提供超过10倍的有效内存带宽和更低的功耗"。

高通将在预配置的机架中交付这些卡片，这些机架将使用"直接液体冷却以提高热效率，PCIe用于扩展，以太网用于横向扩展，机密计算用于安全AI工作负载，机架级功耗为160千瓦"。

今年5月，高通首席执行官克里斯蒂亚诺·阿蒙提出了一些神秘的声明，称公司只会以"独特且颠覆性的产品"进入AI数据中心市场，并将利用其构建CPU的专业知识来"思考关于高性能低功耗推理集群"。

然而，这家骁龙制造商的公告并未提及CPU。它确实表示其加速器建立在高通的"NPU技术领导地位"之上——这无疑是对其在笔记本电脑和移动设备处理器中内置的Hexagon品牌神经处理单元的致敬。

高通最新的Hexagon NPU被集成到骁龙8 Elite SoC中，包括12个标量加速器和8个矢量加速器，支持INT2、INT4、INT8、INT16、FP8、FP16精度。

高通公告中最有说服力的线索是，其新AI产品"为快速生成式AI推理提供机架级性能和卓越的内存容量，具有高性能每美元每瓦特"和"低总拥有成本"。

这种表述解决了AI运营商的三个痛点。

其一是为AI应用供电的能源成本。另一个是高能耗产生大量热量，意味着数据中心需要更多冷却基础设施——这也消耗能源并影响成本。

第三个是加速器可用的内存数量，这一因素决定了它们可以运行什么模型——或者在单个加速器中可以运行多少个模型。

高通表示其AI200装载的768GB内存舒适地超过了英伟达或AMD在其旗舰加速器中提供的容量。

因此，高通似乎在暗示其AI产品可以用更少的资源进行更多推理，随着AI工作负载采用的扩展，这种组合将吸引众多运营商。

这家骁龙制造商还宣布了其新设备的一个客户，即沙特AI公司Humain，该公司"计划从2026年开始使用200兆瓦的高通AI200和AI250机架解决方案，在沙特阿拉伯王国和全球提供高性能AI推理服务"。

但高通表示预计AI250要到2027年才能上市。因此，Humain的公告与其他消息一样，很难评估，因为它省略了关于高通究竟创造了什么以及是否能与其他加速器真正竞争的重要细节。

高通的公告中也没有提及主要的超大规模云服务商是否对其设备表达了兴趣，或者是否可以在本地部署运行。

然而，这一公告标志着高通在过去专注于CPU的尝试失败后重返数据中心市场。投资者显然喜欢这一新举措，该公司股价在周一上涨了11%。

Q&A

Q1：高通AI200和AI250加速器有什么主要特点？

A：AI200每卡支持768GB的LPDDR内存，而AI250采用基于近内存计算的创新内存架构，能提供超过10倍的有效内存带宽和更低功耗，专门针对AI推理工作负载设计。

Q2：高通的机架系统有什么特殊设计？

A：高通的机架系统采用直接液体冷却提高热效率，使用PCIe进行纵向扩展、以太网进行横向扩展，支持机密计算确保AI工作负载安全，机架级功耗为160千瓦。

Q3：高通AI产品何时能够商用部署？

A：AI200预计2026年开始部署，而AI250要到2027年才能上市。沙特AI公司Humain已宣布计划从2026年开始使用200兆瓦的高通机架解决方案。

来源：The Register

0赞

好文章，需要你的鼓励

高通发布AI加速器并计划部署在神秘机架系统中

来源：The Register

2025

10/28

13:45

分享

点赞

PTC：高科技企业数字化转型的4个案例

亚马逊将从Rivian分拆公司Also采购数千辆助力货运车

Accel与Prosus联手支持印度早期创业公司

CIO们在AI时代最看重新员工的哪些能力

LockBit 5.0扩大攻击范围，勒索软件威胁持续升级

AI时代的身体黑客：病理学新发现

COI Energy解决企业售电难题：让闲置电力变现

高通发布AI加速器并计划部署在神秘机架系统中

华盛顿大学Pedro Domingos：当神经网络遇上逻辑推理，Tensor Logic能否成为AI的通用语言？

IBM推出Digital Asset Haven平台助力银行政府安全管理加密货币

Mbodi将在TechCrunch Disrupt 2025展示智能体机器人训练技术

高通进军数据中心AI芯片市场挑战英伟达AMD

Mbodi将在TechCrunch Disrupt 2025展示智能体机器人训练技术

高通进军数据中心AI芯片市场挑战英伟达AMD

Python基金会放弃150万美元政府资助，坚持多元化理念

LinkedIn强制使用用户数据训练AI：一周内不选择退出即视为同意

生成式AI推动数据中心和存储架构深度变革

OpenAI推出"公司知识"功能挑战微软365 Copilot

伯克利大学研究者用AI构建更强负载均衡算法

Sora iOS版将新增三大功能，带来更强视频创作体验

AI助力长寿研究取得新进展

谷歌与IonQ在量子计算领域取得重大突破

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: