高通公司发布了两款全新的AI加速芯片,正式进军蓬勃发展的数据中心市场,直接挑战GPU之王英伟达在AI市场的主导地位。该公司还获得了沙特阿拉伯Humain公司作为新芯片的首个客户。
这家此前专注于移动和无线设备芯片的半导体公司表示,其AI200和AI250芯片将通过全新的内存架构提供机架级性能,以更低成本实现增强的AI推理。新芯片将在2026年(AI200)和2027年(AI250)实现商业化。
蓬勃发展的AI需求引发了全球竞赛,各方都在为数据中心配备更强的AI处理能力。根据研究公司MarketsandMarkets的数据,全球AI数据中心市场预计将从2025年的2360亿美元增长到2030年的超过9330亿美元。据IoT Analytics统计,英伟达在当前数据中心市场占据92%的份额。
对AI芯片领头羊的挑战
英伟达的主导地位主要来自AI训练领域,其高性能GPU是处理这些工作负载的首选硬件。英伟达今年有望从数据中心业务中获得超过1800亿美元的收入。
但专家们认为,在推理领域存在挑战英伟达的机会,因为计算需求将发生转变。高通的新芯片将结合Oryon CPU、Hexagon NPU加速和LPDDR内存以及液体冷却,通过PCIe和以太网进行扩展。
Moor Insights & Strategy首席分析师兼CEO Patrick Moorhead在LinkedIn发文中表示:"高通在数据中心推理效率方面很认真。如果执行得当,它可能从以移动和边缘效率著称转变为机架级AI性能功耗比的领导者——这是市场对高通在更广泛AI生态系统中角色认知的重大转变。"
押注推理市场
高通表示,新芯片将成为多代数据中心AI推理路线图的一部分。该公司的AI软件栈支持机器学习框架、推理引擎和生成式AI框架,以及分解服务等推理优化技术。
Moor Insights and Strategy副总裁兼首席分析师Matt Kimball告诉Data Center Knowledge,高通的推理策略是明智之举。
他在邮件采访中表示:"这是高通的大胆举措,验证了推理市场的机会。高通是一家在选择进入的市场和进入时机方面非常明智的公司。所以,这告诉我推理市场增长即将加速……我认为这里还有更长期的企业级市场机会……在某个时候,这些机架级系统将进入企业市场。"
高通技术规划、边缘解决方案和数据中心高级副总裁兼总经理Durga Malladi表示,这些解决方案相比竞争对手具有成本和灵活性优势。
他在声明中说:"我们正在重新定义机架级AI推理的可能性。"他补充说,公司的软件栈和开放生态系统支持"让开发者和企业比以往任何时候都更容易在我们的优化AI推理解决方案上集成、管理和扩展已训练的AI模型。"
华尔街似乎对这一消息表示欢迎。高通股价在周一交易中上涨超过20%,创下2019年以来最大涨幅。
高通表示,沙特阿拉伯AI初创公司Humain计划从2026年开始部署价值200兆瓦的新芯片。
Futurum Group分析师兼CEO Daniel Newman表示,高通的新AI芯片将使公司"跃入"AI军备竞赛。他在LinkedIn发文中写道:"我们认为这是一个重大转折点,在未来几年为公司带来超过100亿美元的潜在收入,如果在关键市场执行得当,还有显著的上涨空间。"
Q&A
Q1:高通AI200和AI250芯片有什么特点?
A:高通AI200和AI250芯片专为数据中心AI推理设计,采用全新内存架构提供机架级性能,结合Oryon CPU、Hexagon NPU加速和LPDDR内存以及液体冷却技术,通过PCIe和以太网进行扩展,旨在以更低成本实现增强的AI推理能力。
Q2:高通进军数据中心市场的时机如何?
A:AI数据中心市场正在快速增长,预计从2025年的2360亿美元增长到2030年的超过9330亿美元。虽然英伟达目前占据92%的市场份额,但专家认为在AI推理领域存在挑战机会,因为计算需求正在发生转变。
Q3:高通新芯片何时上市,首个客户是谁?
A:高通AI200芯片将在2026年商业化,AI250芯片将在2027年推出。沙特阿拉伯AI初创公司Humain成为首个客户,计划从2026年开始部署价值200兆瓦的新芯片。华尔街对此反应积极,高通股价单日上涨超过20%。
好文章,需要你的鼓励
华盛顿大学Pedro Domingos教授提出的张量逻辑是一种革命性的AI编程语言,它通过将逻辑推理与张量代数在数学层面统一,实现了符号AI和神经网络的深度融合。该语言仅使用张量方程这一种构造,就能优雅地实现从Transformer到形式推理、从核机器到图模型等多种AI范式,更重要的是开辟了在嵌入空间中进行可靠推理的新方向,有望解决大型语言模型的幻觉和不透明性问题,成为推理、数学和编码模型的理想语言。
上海AI实验室等机构联合提出FrameThinker框架,革命性地改变了AI处理长视频的方式。该系统采用"侦探式"多轮推理,先快速扫描全视频获得概览,再有针对性地深入分析关键片段。通过两阶段训练和认知一致性验证,FrameThinker在多个视频理解基准测试中准确率平均提升10.4%,计算效率提高20倍以上,为AI视频理解领域带来突破性进展。
科技巨头IBM今日宣布推出新的区块链数字资产平台,专为金融机构和受监管企业设计。该平台名为"数字资产避风港",将为银行、企业和政府提供比特币、以太坊、稳定币和代币化资产的安全管理服务。平台由IBM与数字钱包基础设施提供商Dfns合作开发,支持超过40个公链和私链的全生命周期管理,并集成第三方身份验证和反洗钱合规工具。
复旦大学团队创建MedQ-Bench基准,首次系统评估AI模型医学影像质量评估能力。研究覆盖五大成像模式,设计感知-推理双层评估体系,意外发现医学专用AI表现不如通用AI。结果显示最佳AI模型准确率仅68.97%,远低于人类专家82.50%,揭示了AI在医学影像质控应用中的现实挑战和改进方向。