AI芯片目前仅占全球芯片产量的0.2%,却贡献了整个行业约50%的总营收。这一数字折射出当前半导体行业的核心现实:AI正在全面重塑芯片设计周期、制造良率优化以及部署架构。然而,据HTEC对全球250位半导体领域C级高管开展的调查显示,目前仅有44%的企业已在多个业务职能中全面嵌入AI,另外56%仍处于试点、有限部署或早期探索阶段,企业级AI整合尚未真正落地。结合调查洞察与HTEC资深半导体专家Craig Melrose和Ian Baird的专业点评,以下几大趋势将主导2026年半导体行业格局。
从硬件堆砌到软件主导:产业结构的根本性转变
当前AI半导体行业的结构犹如一个倒立的金字塔:一端是数以百计的芯片企业、数十亿美元的资本投入和持续的硬件创新,另一端则是运行在这些芯片之上、极为稀薄的量产级AI应用层。这一0.2%与50%的悬殊比例,清晰指明了行业今年的发展方向。Craig Melrose直言:"当前的关注焦点过多集中于硬件本身,而非解决真实世界的实际问题。"
真正跨越鸿沟的企业,将是那些以可在真实企业工作负载(而非实验室环境)中稳定运行的软件栈进入市场的公司。NVIDIA便是最典型的例子——它赢得AI芯片竞争,靠的不是最好的硅片,而是CUDA:足够优秀、足够早期、足够强的生态黏性,使其成为全球AI开发的默认底层基础设施。
Ian Baird直截了当地指出:当前每一款定制加速器面临的核心壁垒,不是硬件性能,而是软件兼容性。Craig Melrose则借用Geoffrey Moore的采用曲线加以阐释:"硬件是创新者,而快速跟随者和主流用户的归属,将由软件来决定。"
能够存活下来的加速器将具备以下共同特征:深度的软件投入、聚焦特定高价值工作负载,以及经过验证的部署模式。一款在某个无人在生产环境中运行的任务上快30%的加速器,不是一门生意;而一款在边缘视频推理任务上效率提升20%、配备完整软件栈并拥有经验证部署路径的加速器,才是。
边缘推理崛起:物理AI重塑部署格局
"AI推理默认运行于云端"这一假设,正面临来自两个方向的双重压力:物理AI应用的快速增长,以及数据中心算力能耗成本的持续攀升。Craig明确表示:"物理AI将以边缘部署为主。"机器人、自动驾驶汽车和工厂车间系统,都要求在行动发生的现场完成推理——一台人形机器人不可能等待一次云端往返通信后,才决定如何抓取物体。
然而,真正的瓶颈不在硬件,而在软件。当前NPU(神经网络处理单元)生态极度碎片化:AMD、英特尔、高通、苹果以及数十家厂商已各自推出架构与工具链互不兼容的神经处理单元。Ian直接点明了这一难题:"边缘AI真正困难的地方,不是把足够强大的芯片送到边缘端,而是让软件在所有这些设备上都能正确运行。"边缘推理的硬件正在就位,配套的软件生态却远未跟上。
Chiplet架构与异构计算的全面普及
单片GPU作为默认AI算力平台的时代正在落幕。AI工作负载的多样性,使得专用化在规模经济层面愈发具有吸引力。Chiplet架构允许企业从不同来源和不同制程节点混搭计算、内存与I/O组件,实现了单片芯片设计时代难以企及的定制化能力。
Craig提到了以非常规方式切入硬件市场的公司,例如Modular——它们正在构建Chiplet和模块化硬件,重新定义"一颗芯片"的内涵。Ian则以HTEC自身的客户D-Matrix为例:该公司将超低延迟内存与计算深度集成,专门针对视频生成和提示处理等推理工作负载进行优化。谷歌的TPU、微软的Maia、亚马逊的Trainium,本质上都是同一个方向上的赌注。超大规模云服务商早在数年前便已洞察这一趋势,而到2026年,其余市场参与者也将全面跟进。
能耗约束下的推理效率优化
当能耗成为核心约束,效率便是最深的护城河。推理优化的前沿,正越来越多地转向软件侧。采购对话的重心已从峰值算力转向每瓦浮点运算次数、每次查询延迟和每次推理成本。模型蒸馏、量化、编译器调优、根据实际工作负载需求合理配置模型规模——这些软件层面的推理优化手段,才是2026年至2027年实现有效性能提升的关键所在。一个经过精心优化、运行在高效芯片上的小型模型,在几乎所有生产场景中都将胜过运行在高耗能芯片上的过度规格化模型。
能源供给危机:被严重低估的系统性风险
AI基础设施建设中有一个关键风险正在被严重低估:能源供给的增长速度,远未跟上AI算力需求的扩张步伐。作为新增电力最快路径的燃气轮机,其产能已被预订至2028年,电力供应已成为数据中心扩张的硬性约束。美国内华达州已有本地电力公司计划将数据中心用电需求优先于现有电信基础设施,此类案例预示着这些约束将以何种方式在实践中显现。
Craig直接提出了这一问题的下游影响:"如果数据中心面临能源短缺,依赖数据中心的系统会发生什么?如果一个关键生产系统对云端推理存在实时依赖,而那个数据中心发生电力不稳定,谁来承担责任?"这绝非理论层面的忧虑,而是切实的运营挑战。那些现在就通过边缘部署和工作负载优先级管理构建韧性的企业,将在约束加剧时占据更有利的位置。
物理世界的AI嵌入:下一轮需求浪潮
下一波AI芯片需求将来自嵌入物理系统的AI,涵盖机器人、车辆、工厂和消费电子设备。Craig认为这一进程已经启动:需要本地实时推理的应用场景,正以远超上一周期以数据中心为中心的应用场景更快的速度不断涌现。
智能手表、便携式心电图仪、智能戒指等消费设备,以及工业自动化和自动驾驶汽车,均需要边缘推理、高能效、特定领域的软件栈,以及在远非受控数据中心的复杂环境中让AI可靠运行的能力。而这些,恰恰也是当前软件工具最难以应对的应用场景。那些真正弄清楚如何让AI在物理世界中运行的公司,正是那些从一开始就明白硬件与软件从来不是两个独立问题的公司。
结语
半导体领域的硬件竞赛已全面展开,但最终的胜负将在软件层面见分晓。能够在行业洗牌中存活下来的加速器和平台,必将是那些连接经过验证的应用场景、依托强大软件生态支撑、并针对边缘优先、能耗受限的现实部署条件进行专门设计的产品。
Q&A
Q1:为什么AI芯片只占芯片产量的0.2%,却能占到行业收入的50%?
A:这反映的是AI芯片的极高价值密度。AI训练和推理对算力要求极高,使用的芯片(如GPU、TPU等)单价远高于普通芯片,且云服务商和科技巨头愿意为其支付大量资金。虽然数量占比极小,但每颗芯片的附加值极高,因此在整体营收中占据了异乎寻常的份额。这也说明AI正在成为半导体行业最重要的增长驱动力。
Q2:Chiplet架构相比传统单片芯片有什么优势?
A:Chiplet架构允许企业将来自不同来源、不同制程节点的计算、内存和I/O组件灵活组合,从而实现高度定制化,这在单片芯片设计时代几乎无法实现。它的优势在于:可以针对特定工作负载(如推理、训练)优化各个模块,降低研发成本,提高良率,并加快产品迭代速度。谷歌TPU、微软Maia、亚马逊Trainium等都是这一架构思路的典型代表。
Q3:为什么说能源供给是AI数据中心扩张面临的硬性约束?
A:目前AI算力需求增长极为迅猛,但能源供给的扩张速度远远跟不上。作为快速增加电力供应最可行方式的燃气轮机,其产能已被预订至2028年。部分地区的电力公司已开始优先保障数据中心用电,甚至可能挤占其他基础设施的供电资源。一旦数据中心出现电力短缺,依赖云端推理的关键生产系统将面临严重的可用性和责任归属问题。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。