"给我Token,快速给、廉价给、现在就给。"
这是生成式AI模型开发者的普遍心声,也是Parasail CEO迈克·亨利每天听到的呼声。Parasail是一家专为企业提供AI推理云计算服务的公司,亨利向TechCrunch透露,该平台每天处理的Token数量高达5000亿个——这正是Token极限化利用的最佳诠释。
亨利此前曾在专注于大语言模型芯片的公司Groq担任高管,主导构建了该公司的云服务业务。这一经历让他意识到,在AI模型上开发软件的开发者,需要专门为其需求定制的云计算能力。从隐秘运营状态公开亮相一年后,Parasail现已完成3200万美元的A轮融资,准备将这一模式推向更大规模。
亨利本人拥有芯片物理设计背景,但Parasail并不执着于拥有自己的芯片。公司虽配备了部分自有GPU,但主要模式是在全球15个国家的40个数据中心租用算力,并通过流动性市场采购额外资源,在幕后进行统一调度,以此压低推理请求的成本。
通过合理分配工作负载、规避需求高峰,Parasail得以与那些自持芯片但可能受现有客户承诺和负载制约的企业同台竞争。
该公司的发展潜力建立在开源模型以及前沿实验室以外的智能体持续扩散这一前提之上。Parasail的高管和投资人认为,这一趋势的驱动力在于使用Anthropic、OpenAI等公司产品的成本不断攀升和摩擦增加。
Elicit的CEO安德烈亚斯·施图尔米勒观察到一种混合架构正在兴起。Elicit是一家已完成2200万美元A轮融资的初创公司,专注于为科学文献研究开发AI助手。其顶级制药公司客户使用这款基于大语言模型的工具,对数万篇科学论文的数据进行审阅与分析。
"我们越来越倾向于使用开源模型,因为向一个API端点发送数十万次请求实在代价高昂,"施图尔米勒向TechCrunch表示。尤其是在该公司开始依靠智能体来优化产品、拆分任务并在更长时间维度上进行更具策略性的规划之后,这一矛盾更加突出。开源模型先负责初步筛选以降低整体成本,再由能力更强的前沿模型给出最终答案。
随着智能体在软件开发中日益普及,模型查询请求呈爆发式增长,也带动了对Parasail这类廉价推理基础设施提供商的投资热情。本轮融资的联合领投方Touring Capital合伙人萨米尔·库马尔向TechCrunch表示,他预计未来推理成本将占软件开发总成本的至少20%。
在竞争激烈的云计算赛道,Parasail能分到多大份额?亨利认为,公司专注于推理业务(不提供模型训练服务)、愿意在无需长期合约的情况下服务初创客户,使其有别于以企业客户为主的大型云服务商,也在某种程度上超越了Fireworks AI、Baseten等资金更雄厚的云推理竞争对手。
当然,当所有客户都是处于种子轮至B轮阶段、身处充满不确定性的AI行业的初创公司时,这本身也意味着一种独特的风险。
本轮融资的另一联合领投方Kindred Ventures合伙人史蒂夫·张表示,模型部署的经济规律决定了市场对Parasail所提供的算力经纪服务存在真实需求——而这还是在内容生成和机器人领域的模型大规模普及之前。
"所有人都以为AI存在泡沫,但其实根本没有,"他向TechCrunch说道,"推理需求远远超过了供给。"
Q&A
Q1:Parasail是做什么的,和普通云服务有什么区别?
A:Parasail是一家专注于AI推理的云计算服务商,每天处理5000亿个Token。与AWS、Azure等综合云服务不同,Parasail只做推理、不做训练,在全球15个国家40个数据中心租用算力并统一调度,通过智能分配工作负载和规避需求高峰来压低推理成本。此外,它不要求客户签订长期合约,对初创公司更友好,与Fireworks AI、Baseten等同类竞品相比也具备一定差异化优势。
Q2:为什么越来越多的开发者选择开源模型而不是OpenAI或Anthropic的API?
A:主要原因是成本和摩擦。向OpenAI或Anthropic等公司的API端点发送数十万甚至数百万次请求,费用极高且存在诸多限制。以Elicit为例,其为制药公司审阅数万篇科学论文时,选择先用开源模型做初步筛选以控制成本,再用前沿模型给出最终答案,形成一种混合架构。随着智能体在软件开发中的普及,这种模式将愈发普遍。
Q3:AI推理市场目前的规模和前景如何?
A:投资方Touring Capital合伙人萨米尔·库马尔预计,未来推理成本将占软件开发总成本的至少20%。Kindred Ventures合伙人史蒂夫·张则明确表示"AI没有泡沫,推理需求远超供给"。随着智能体应用的爆发以及内容生成、机器人领域的持续扩张,AI推理基础设施市场仍处于早期高速增长阶段。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。