云计算公司Akamai周二宣布,计划在全球超过4000个站点部署"数千台"Nvidia Blackwell GPU、DPU和服务器,以增强其AI推理能力。
该公司表示,分布式AI基础设施将有助于减少延迟,并在推理需求持续增长的背景下提升其全球运营的整体性能。创建统一平台将增强AI研究开发、微调和推理能力。
此消息紧随Akamai最近扩展AI推理和计算能力的努力。10月份,该公司发布了Akamai推理云服务,承诺将AI推理能力更贴近用户和设备。
Akamai云技术集团首席运营官兼总经理Adam Karon在声明中表示:"在超大规模云服务商继续推动AI训练边界的同时,Akamai专注于满足推理时代的独特需求。通过在我们的全球网络中分布推理优化的计算资源,Akamai不仅仅是增加容量,我们正在提供将AI从实验室带到街角所需的规模化、低延迟解决方案。"
Akamai表示,与超大规模云基础设施相比,该分布式平台可将延迟减少2.5倍,为企业节省高达86%的AI推理成本。这种分布式架构将使AI能够与现实世界系统交互,如自动配送系统、智能电网和外科手术机器人,而不受传统云服务地理位置或成本限制的约束。
竞争格局
主要竞争对手Cloudflare使用跨越200多个城市的无服务器推理平台。Cloudflare的Workers AI在无需专用GPU集群的情况下提供低于100毫秒的全球推理服务。另一个竞争对手Fastly使用边缘平台,在可编程计算方面表现出色,使用较少的本地化接入点来处理CPU/GPU任务。
尽管Akamai面临灵活的竞争对手,但该公司押注大规模GPU部署将加速关键任务场景的边缘原生AI,并将依靠其地理规模优势。
Akamai的这一宣布也标志着Nvidia在市场向推理用例转变过程中的重大胜利。在推理方面,Nvidia正面临更多芯片竞争。
MarketsandMarkets的报告显示,AI推理市场预计到2030年将增长至近2550亿美元,复合年增长率为19.2%。
向分布式推理的转变
AI的爆炸式增长暴露了超大规模云服务商中心化模式(如AWS、Azure、Google Cloud)的局限性,这些大规模集中式数据中心在训练方面表现出色,但在实时、低延迟推理方面存在困难。推理——运行训练好的模型进行预测——需要靠近用户和设备以确保响应性、最小化数据传输成本,并支持数十亿边缘交互的可扩展性。
到2026年,这一宣布强调推理时代属于分布式架构。Akamai的大胆GPU部署可能会加速关键任务实时用例的边缘原生AI采用。竞赛已经开始:谁能最好地连接集中式训练与无处不在的边缘执行,将定义AI基础设施的下一个阶段。
Q&A
Q1:Akamai的分布式AI推理基础设施有什么优势?
A:Akamai的分布式平台可将延迟减少2.5倍,为企业节省高达86%的AI推理成本。通过在全球超过4000个站点分布推理优化的计算资源,能够使AI与自动配送系统、智能电网和外科手术机器人等现实世界系统交互,不受传统云服务地理位置或成本限制。
Q2:AI推理市场的发展前景如何?
A:根据MarketsandMarkets的报告,AI推理市场预计到2030年将增长至近2550亿美元,复合年增长率为19.2%。推理时代正在到来,需要更加靠近用户和设备的分布式架构来满足实时、低延迟的需求。
Q3:Akamai与竞争对手相比有什么特点?
A:与主要竞争对手相比,Cloudflare使用跨越200多个城市的无服务器推理平台,Fastly使用较少本地化接入点处理CPU/GPU任务。而Akamai依靠其地理规模优势,通过大规模GPU部署来加速关键任务场景的边缘原生AI应用。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。