人工智能加速器芯片被大肆炒作,但这个市场究竟有多大,如今有哪些公司是真的在卖人工智能芯片的?
来自ABI Research的两份新报告详细分析了当今人工智能芯片组市场的发展状况。其中,ABI Research首席分析师Lian Jye Su谈到了正在进入这个潜在利润丰厚市场的公司和技术。
第一份题为“云AI芯片组:市场格局和厂商定位”的报告,突出了云AI推理和训练服务的快速增长情况。ABI Research由此预计,AI芯片组市场规模预计将从2019年的42亿美元增长到2024年的100亿美元。目前这一领域的领导者Nvidia和英特尔正受到来自Cambricon Technologies、Graphcore、Habana Labs和Qualcomm等公司的挑战。
据Su介绍,Nvidia仍然是这个市场明显的领导者,这主要取决于Nvidia具有成熟的开发者生态系统及先发优势。
“随着人工智能模型、库和工具包的不断变化和更新,Nvidia成为了一个很好的选择,因为它能提供通用AI芯片组。当然,随着市场的不断成熟,这些优势将逐渐弱化,但至少在可预见的未来,Nvidia仍将处于强势地位。”
今天的云AI芯片组市场可以分为三个部分:首先是托管公有云的云服务提供商,包括AWS、微软、谷歌、阿里巴巴、百度和腾讯等;其次是企业数据中心,也就是私有云;此外,还有混合云,也就是公有云和私有云(VMware、Rackspace、NetApp、HPE、Dell)的结合体。
该报告还确定了另一个新兴的细分市场——电信云,指的是电信公司为其核心网络、IT和边缘计算工作负载部署的云基础设施。
Su表示,这个新的细分市场为AI芯片组制造商带来了巨大的机遇。
“我们已经看到了像华为这样的网络基础设施厂商,还有诺基亚这样的厂商,推出了针对电信网络功能进行优化的ASIC。这是一个巨大的市场,Nvidia最近也一直在努力进入这个市场。”
2017年至2024年人工智能芯片组年销售总收入(来源:ABI Research)
虽然Su认为短时间内其他厂商无法取代Nvidia在云端AI训练领域的主导地位,但具体在AI推理领域却并非由一家厂商主导,这在一定程度上是由推理工作负载在垂直方向各有不同的性质决定的。他说,预计ASIC将从2020年开始在该细分领域实现强劲增长。
眼下,将AI推理转移到边缘设备这一趋势意味着智能手机、自动驾驶汽车和机器人等设备对云的依赖减少了,但这并不意味着推理工作负载——一些云服务提供商认为推理工作负载要比训练工作负载大——就会减少,Su这样表示。
“一些人工智能永远不会走向边缘,例如聊天机器人和会话AI、欺诈监控和网络安全系统。这些系统将从基于规则的系统发展为基于深度学习的人工智能系统,这实际上会增加推理的工作量,使其足以取代那些转向边缘的推理工作负载。”
此外,谷歌的TPU可以解决在云端进行训练和推理问题,被视为CPU和GPU技术(分别由英特尔和Nvidia主导)的强大挑战者。正如报告所述,谷歌在TPU上取得的成功为其他自主开发AI加速器ASIC的云服务提供商(CSP)提供了蓝图,例如已经行动起来的华为、AWS和百度。
如果云服务提供商都在使用他们自己的芯片组,那么对于其他芯片组提供商来说,这个细分领域还有市场空间吗?
“这对于刚开始使用自己芯片组的CSP来说是极具挑战的,我们甚至预测,到2024年CSP这个市场将下降15%至18%。而机会更多地来自于私有数据中心领域。银行机构、医疗机构、研发实验室和学术界仍然需要运行人工智能,他们会考虑使用那些针对AI工作负载进行了更多优化的芯片组,这就给Cerebras、Graphcore、Habana Labs和Wave Computing等新手提供了一些优势。
其他将从这些趋势中受益的是IP核心授权厂商,例如ARM、Cadence和VeriSilicon,他们将负责帮助那些甚至是开始自主研发的企业进行芯片组设计。
ABI第二份题为“边缘AI芯片组:技术展望和使用案例”的报告称,2018年边缘人工智能推理芯片组市场规模为19亿美元,边缘训练市场规模为140万美元。
今天有哪些应用是在边缘位置进行训练的?Su解释说,这些数据中包括网关(历史数据库或设备Hub)和内部部署服务器(在私有云中,但物理位置是靠近AI数据生成的地方)。专为内部部署服务器的训练任务设计的芯片组包括Nvidia的DGX,华为的网关和服务器,其中包括Ascend 910芯片组,以及针对来自Cerebras System、Graphcore和Habana Labs等内部部署数据中心的系统级产品。
“‘边缘训练’市场仍然很小,因为云仍然是人工智能训练的首选,”Su说。
2017年至2024年,针对推理和培训的AI芯片组年销售总收入(来源:ABI Research)
边缘AI推理是2019年至2024年期间边缘人工智能市场实现31%复合年增长率的主要推动力。Su提到了三个主要市场(智能手机/可穿戴设备、汽车、智能家居/白色家电)以及三个利基市场。
第一个利基市场是机器人,因为依赖多种类型的神经网络,机器人通常需要异构的计算架构,例如用于导航的SLAM(同时定位和映射),用于人机界面的会话AI,用于对象检测的机器视觉,所有这些都会在不同程度上使用CPU、GPU和ASIC。目前,Nvidia、英特尔和高通正在这个领域进行激烈的竞争。
第二个利基市场是智能工业应用,涉及制造业、智能建筑、石油和天然气领域。我们看到,FPGA厂商因为遗留设备的原因在这一领域表现突出,但同时也要归功于FPGA架构的灵活性和适应性。
最后一个利基市场是“非常边缘”,即将超低功耗AI芯片组嵌入WAN网中的传感器和其他小端节点中。由于重点是超低功耗,因此这个领域主要由FPGA厂商、RISC-V设计和ASIC厂商主导。
那么到目前为止,谁在边缘人工智能推理领域领跑?
“意料外——或者意料内的——的是,智能手机AI ASIC厂商在这个领域占据领先,因为智能手机的出货量是很大的,例如苹果、海思半导体、高通、三星以及联发科等,如果说的是初创公司的话,我认为Hailo、Horizon Robotics和Rockchip似乎相对终端设备制造商来说发展势头相当快。”
Su还表示,软件对于边缘AI芯片组的商业实施和部署来说至关重要,Nvidia正在升级编译工具和构建开发人员社区,相比之下,英特尔和Xilinx的策略是初创公司合作,或者收购拥有基于软件的加速解决方案。
“芯片组厂商应该考虑向开发者社区提供工具包和库,通过开发者训练计划、竞赛、论坛和大会等方式进行,因为这能吸引开发者与芯片组厂商展开合作以开发相关应用,所有这些都不是初创公司可以轻易实现的。”
该报告给出的结论是,除了为开发者社区提供合适的软件和支持外,厂商还应该提供良好的开发路线图,以及其他技术价值链的支持,此外还需要让他们的芯片有大规模的使用案例,以及具有竞争力的定价。
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。