AI算力争夺战中,谁会成为下一个Cerebras?

AI推理算力需求持续爆发,初创公司General Compute完成1500万美元种子轮融资,融后估值6000万美元,由FUSE VC领投。该公司专注AI推理云服务,选择采用Intel支持的SambaNova专用芯片,其新一代芯片推理速度可达600-700 tokens/秒,远超GPU的250 tokens/秒。该芯片支持风冷部署,可降低数据中心基础设施成本,General Compute已订购价值3亿美元的SN50芯片。

对AI模型运行所需算力的强劲需求持续攀升,但任何入局者都必须跨越两大障碍:获取合适的芯片,以及将芯片部署进数据中心并开始创造收益。

General Compute是一家新兴的推理云服务商,专注于AI模型完成训练后的推理阶段——即模型实时运行并响应用户请求的环节。这家公司针对上述两大问题给出了自己的答案,也由此揭示了AI生态系统的未来走向。凭借这些答案,General Compute完成了一轮1500万美元的种子轮融资,投后估值达6000万美元,由FUSE VC领投,Carya Venture Partners和Village Global Ventures参投。

那么,什么才是合适的芯片?GPU的需求量已急剧攀升,但业界越来越形成共识:GPU并非运行AI模型的最佳选择。AI模型在推理阶段——即主动生成响应的过程——所需的算力结构与训练阶段存在本质差异,专为推理设计的新一代芯片正在兴起。英伟达去年12月斥资200亿美元收购Groq,以及Cerebras上周完成的570亿美元IPO,都印证了这一趋势。

在Groq和Cerebras产能均趋于紧张的背景下,General Compute联合创始人、CEO Finn Puklowski与CTO Jason Goodison找到了另一条路——采用SambaNova的专用芯片。SambaNova是一家专注于推理芯片的英特尔系企业,近年来在硅谷的声量有所减弱。

但随着SambaNova今年推出新一代芯片,这一局面或将改变。新架构灵活性更强,在推理计算过程中采用更大容量内存存储上下文,SambaNova声称其性能不仅超越GPU,更优于Groq、Cerebras等公司的同类专用芯片。Puklowski透露,新芯片的Token生成速度可达每秒600至700个,而GPU约为每秒250个。

General Compute已订购价值3亿美元的SambaNova SN50芯片,并称将成为首家部署该芯片的云服务商。

这款芯片还顺带解决了第二大难题——部署场所问题。SN50采用风冷而非水冷设计,功耗更低,可直接安装于现有数据中心设施,无需新增基础设施投入。

Puklowski正在积极拓展托管合作协议,这种模式下General Compute将自有硬件部署于合作方的场地。合作对象不仅限于数据中心运营商,还包括加密货币矿工——由于比特币生产成本长期高于币价,这些矿工正寻求将现有基础设施转型再利用。

General Compute已于上周正式推出云服务,并宣称目前在运行强大开源大语言模型MiniMax 2.7方面速度最快。

风险投资人Joe Hassleman早在2021年便投资了Groq,踏上了推理算力浪潮的早班车。今年,他设立了专注AI领域的新基金Evercrest Partners,并将General Compute作为首个投资标的。在他看来,SambaNova与General Compute的合作关系,与Coreweave和英伟达的深度绑定如出一辙,也颇似Groq在芯片制造与其前云服务之间的协同模式。

"他们确实需要找到一批优质客户,把芯片部署进高速增长的应用环境中,"Hassleman说,"General Compute在押注SambaNova,而SambaNova同样在押注General Compute,双方是相互赌注的关系。"

真正的核心问题在于:在AI的未来图景中,哪种计算架构将成为最大的价值收割者?推理云服务的崛起,本质上是对一个多模型、多智能体共存世界的隐性押注——在那个世界里,没有任何单一供应商能够一统天下,推理的速度与成本将成为核心竞争变量。本周OpenRouter完成的1.13亿美元B轮融资正是佐证——该公司能够为客户提供多模型接入,帮助优化Token使用成本。

在这套逻辑中,速度至关重要,直接影响价格与能力表现。Puklowski希望将编程智能体原本需要一小时完成的任务压缩至五到十分钟,同时让用于客服场景的语音智能体——其对话流畅度高度依赖推理速度——变得更加经济实惠。"如果ChatGPT能给你每秒50个Token的输出速度,已经远超人类的阅读速度了,"Puklowski对TechCrunch说,"但现在的场景已经演进到智能体之间的互动,智能体要替我们读取信息、查询数据库,它们需要更快。"

Q&A

Q1:General Compute是一家什么样的公司?它主要做什么业务?

A:General Compute是一家专注于AI推理阶段的新兴云服务商,提供AI算力租赁服务。与训练阶段不同,推理阶段是指模型完成训练后实时响应用户请求的过程。该公司采用SambaNova的专用推理芯片,主打高速、低成本的推理云服务,目前已上线云服务平台,并宣称是运行开源大语言模型MiniMax 2.7速度最快的服务商。

Q2:SambaNova芯片相比GPU和其他专用芯片有哪些优势?

A:SambaNova新一代芯片在推理场景下具备多项优势:Token生成速度可达每秒600至700个,是GPU(约250个/秒)的两倍以上;架构更灵活,推理计算时上下文存储内存更大;采用风冷设计、功耗更低,无需改造现有数据中心即可部署,大幅降低基础设施成本。SambaNova声称其性能超越GPU,以及Groq、Cerebras等同类专用芯片。

Q3:推理云服务为什么越来越受到资本关注?

A:随着AI应用从单一模型响应向多智能体协作演进,推理速度和成本成为关键竞争变量。智能体之间需要高速交互、实时读取数据,对推理性能要求远超人类交互场景。资本正在押注一个多模型共存、无单一供应商主导的AI生态——在这个生态中,推理云服务商有望占据重要价值节点。Groq、Cerebras的高估值,以及OpenRouter本周完成的1.13亿美元融资,均印证了市场对这一赛道的高度认可。

来源:Techcrunch

0赞

好文章,需要你的鼓励

2026

05/29

15:49

分享

点赞

邮件订阅