AI算力争夺战中，谁会成为下一个Cerebras？

AI推理算力需求持续爆发，初创公司General Compute完成1500万美元种子轮融资，融后估值6000万美元，由FUSE VC领投。该公司专注AI推理云服务，选择采用Intel支持的SambaNova专用芯片，其新一代芯片推理速度可达600-700 tokens/秒，远超GPU的250 tokens/秒。该芯片支持风冷部署，可降低数据中心基础设施成本，General Compute已订购价值3亿美元的SN50芯片。

对AI模型运行所需算力的强劲需求持续攀升，但任何入局者都必须跨越两大障碍：获取合适的芯片，以及将芯片部署进数据中心并开始创造收益。

General Compute是一家新兴的推理云服务商，专注于AI模型完成训练后的推理阶段——即模型实时运行并响应用户请求的环节。这家公司针对上述两大问题给出了自己的答案，也由此揭示了AI生态系统的未来走向。凭借这些答案，General Compute完成了一轮1500万美元的种子轮融资，投后估值达6000万美元，由FUSE VC领投，Carya Venture Partners和Village Global Ventures参投。

那么，什么才是合适的芯片？GPU的需求量已急剧攀升，但业界越来越形成共识：GPU并非运行AI模型的最佳选择。AI模型在推理阶段——即主动生成响应的过程——所需的算力结构与训练阶段存在本质差异，专为推理设计的新一代芯片正在兴起。英伟达去年12月斥资200亿美元收购Groq，以及Cerebras上周完成的570亿美元IPO，都印证了这一趋势。

在Groq和Cerebras产能均趋于紧张的背景下，General Compute联合创始人、CEO Finn Puklowski与CTO Jason Goodison找到了另一条路——采用SambaNova的专用芯片。SambaNova是一家专注于推理芯片的英特尔系企业，近年来在硅谷的声量有所减弱。

但随着SambaNova今年推出新一代芯片，这一局面或将改变。新架构灵活性更强，在推理计算过程中采用更大容量内存存储上下文，SambaNova声称其性能不仅超越GPU，更优于Groq、Cerebras等公司的同类专用芯片。Puklowski透露，新芯片的Token生成速度可达每秒600至700个，而GPU约为每秒250个。

General Compute已订购价值3亿美元的SambaNova SN50芯片，并称将成为首家部署该芯片的云服务商。

这款芯片还顺带解决了第二大难题——部署场所问题。SN50采用风冷而非水冷设计，功耗更低，可直接安装于现有数据中心设施，无需新增基础设施投入。

Puklowski正在积极拓展托管合作协议，这种模式下General Compute将自有硬件部署于合作方的场地。合作对象不仅限于数据中心运营商，还包括加密货币矿工——由于比特币生产成本长期高于币价，这些矿工正寻求将现有基础设施转型再利用。

General Compute已于上周正式推出云服务，并宣称目前在运行强大开源大语言模型MiniMax 2.7方面速度最快。

风险投资人Joe Hassleman早在2021年便投资了Groq，踏上了推理算力浪潮的早班车。今年，他设立了专注AI领域的新基金Evercrest Partners，并将General Compute作为首个投资标的。在他看来，SambaNova与General Compute的合作关系，与Coreweave和英伟达的深度绑定如出一辙，也颇似Groq在芯片制造与其前云服务之间的协同模式。

"他们确实需要找到一批优质客户，把芯片部署进高速增长的应用环境中，"Hassleman说，"General Compute在押注SambaNova，而SambaNova同样在押注General Compute，双方是相互赌注的关系。"

真正的核心问题在于：在AI的未来图景中，哪种计算架构将成为最大的价值收割者？推理云服务的崛起，本质上是对一个多模型、多智能体共存世界的隐性押注——在那个世界里，没有任何单一供应商能够一统天下，推理的速度与成本将成为核心竞争变量。本周OpenRouter完成的1.13亿美元B轮融资正是佐证——该公司能够为客户提供多模型接入，帮助优化Token使用成本。

在这套逻辑中，速度至关重要，直接影响价格与能力表现。Puklowski希望将编程智能体原本需要一小时完成的任务压缩至五到十分钟，同时让用于客服场景的语音智能体——其对话流畅度高度依赖推理速度——变得更加经济实惠。"如果ChatGPT能给你每秒50个Token的输出速度，已经远超人类的阅读速度了，"Puklowski对TechCrunch说，"但现在的场景已经演进到智能体之间的互动，智能体要替我们读取信息、查询数据库，它们需要更快。"

Q&A

Q1：General Compute是一家什么样的公司？它主要做什么业务？

A：General Compute是一家专注于AI推理阶段的新兴云服务商，提供AI算力租赁服务。与训练阶段不同，推理阶段是指模型完成训练后实时响应用户请求的过程。该公司采用SambaNova的专用推理芯片，主打高速、低成本的推理云服务，目前已上线云服务平台，并宣称是运行开源大语言模型MiniMax 2.7速度最快的服务商。

Q2：SambaNova芯片相比GPU和其他专用芯片有哪些优势？

A：SambaNova新一代芯片在推理场景下具备多项优势：Token生成速度可达每秒600至700个，是GPU（约250个/秒）的两倍以上；架构更灵活，推理计算时上下文存储内存更大；采用风冷设计、功耗更低，无需改造现有数据中心即可部署，大幅降低基础设施成本。SambaNova声称其性能超越GPU，以及Groq、Cerebras等同类专用芯片。

Q3：推理云服务为什么越来越受到资本关注？

A：随着AI应用从单一模型响应向多智能体协作演进，推理速度和成本成为关键竞争变量。智能体之间需要高速交互、实时读取数据，对推理性能要求远超人类交互场景。资本正在押注一个多模型共存、无单一供应商主导的AI生态——在这个生态中，推理云服务商有望占据重要价值节点。Groq、Cerebras的高估值，以及OpenRouter本周完成的1.13亿美元融资，均印证了市场对这一赛道的高度认可。

来源：Techcrunch

0赞

好文章，需要你的鼓励

AI算力争夺战中，谁会成为下一个Cerebras？

来源：Techcrunch

2026

05/29

15:49

分享

点赞

“驯服”千亿模型，鏖战“黑猴打瓦”，龙虾“一键接管” ，锐龙AI Max+ 395开启全能桌面AI主机“王炸”时刻

豪声电子泰国电声工厂初步投产：2500万泰铢项目进入产能爬坡

地瓜机器人将560TOPS端侧算力，加载到了20+头部团队机器人中

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

牙科诊所软件漏洞修复：患者医疗记录曾遭泄露

关键基础设施巨头Itron确认遭遇网络攻击

Vercel数据泄露范围扩大，黑客早于已知时间节点已入侵

苹果与博通签署300亿美元协议，共同生产美国本土无线芯片

摩托罗拉领投BRINC 1.25亿美元，推动紧急救援无人机大规模扩张

AI赋能芯片设计：前景广阔，疑问犹存

Arm今夏将推出自研芯片，Meta成首批客户

美国运通高管分享：AI智能体时代成功创新者的4个关键方法

微软开源两款工具，将AI智能体安全检测前置于开发流程

IBM推出云合规与可见性平台，加码数字主权布局

YouTube为付费用户推出播客新功能，含AI推荐工具与自动调速

我是iPhone用户，但安卓Auto上的Gemini车载体验全面超越Siri

YouTube为付费用户推出播客专属功能升级

苹果与谷歌AI合作新细节曝光，涉及英伟达芯片

Rivian软件主管：AI让CarPlay争论"彻底过时"

比亚迪发布中国首款自研4纳米智能驾驶芯片，算力突破2100 TOPS

Waymo推出Ojai无人出租车，搭载第六代自动驾驶系统

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: