人工智能推理路由初创公司OpenRouter今日宣布完成1.13亿美元新一轮融资,由Alphabet旗下独立增长基金CapitalG领投,旨在推动生成式AI模型访问服务的发展。
参与本轮B轮融资的其他投资方包括英伟达旗下风险投资部门NVentures、ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures和Databricks Ventures,以及现有投资者Andreessen Horowitz和Menlo Ventures。
OpenRouter为个人开发者和企业提供快速便捷的接口,用于访问、路由和优化集中式闭源AI模型提供商和开源模型。该平台拥有数百个模型和提供商的市场,允许AI应用和智能体通过单一统一接口挑选最佳模型和提供商。
同时,该公司的接口提供单一控制面板,用于计费、跟踪使用情况和推理以及执行规则。企业可以添加策略,如每次请求的数据处理策略、团队级访问和路由权限,从而限制支出、获得支出级别的可见性并支持审计友好的使用报告,同时通过智能路由提高成本效益和性能。
对于注重正常运行时间的企业,该公司还提供智能故障转移以提高可靠性。通过单一易用接口访问多个供应商,意味着开发者和企业可以在没有供应商锁定或风险的情况下进行实验。
联合创始人兼首席执行官Alex Atallah表示:"大规模运行推理从根本上是一个多模型问题。选择单一模型的时代已经结束。现在的成功取决于在不断变化的市场中持续路由。"
AI采用率上升及相关成本
一家公司每月消耗近10亿个Token进行推理并不罕见。Token是大语言模型(如ChatGPT)使用的数据处理原子单位,通常是一个单词、单词的一部分或标点符号。处理输入和输出Token都需要成本。
以规模为例,OpenAI的GPT-5.5推理成本为每100万输入Token 5美元,每100万输出Token 30美元,是5.4版本价格的两倍。这并不意外,因为GPT-5.5是由集中式行业领导者提供的强大旗舰前沿模型。OpenRouter还提供访问更小的开源模型,这些模型价格显著降低但仍然强大,例如Qwen3.7 Max的价格为每100万输入Token 2.50美元,每100万输出Token 7.50美元。
根据德勤最近的一项研究,67%的企业每月已经计算近10亿个Token。随着更多AI智能体进入市场,用户适应能够对音频、图像和视频进行推理的模型,消耗的Token数量只会进一步膨胀。
与此同时,企业正在寻找方法,通过在针对特定推理类型优化的模型之间路由不同类型的需求来控制成本。例如,公司可能将摘要任务发送到较小的纯文本模型,而将多模态体验(如音频或视频)交由专门为此目的设计的更昂贵模型处理。然后可以将其答案传回较小的编排器模型,该模型可以与业务信息一起解析输出。
这些相互竞争的成本和性能需求造成了一定程度的运营复杂性,这意味着企业必须构建自己的工具来支持这种路由,或者注册OpenRouter等平台,该平台提供集中式控制平面来优化成本、延迟和能力。
OpenRouter将其自己的使用情况和模型排名作为开放数据提供,这些数据已成为AI行业广泛参考的信号,用于了解特定模型实际采用趋势、性能动态和定价决策。该公司的业务量已激增至每周约25万亿Token,比六个月前的每周5万亿Token增长了五倍。该平台目前支持超过800万全球用户,包括AI原生初创公司和大型企业。
该公司表示,计划利用新资金扩展其路由、治理和优化能力,因为企业继续在其运营中采用、部署和扩展AI。
Q&A
Q1:OpenRouter是什么?它能做什么?
A:OpenRouter是一家人工智能推理路由初创公司,为开发者和企业提供快速便捷的接口,用于访问、路由和优化各种AI模型。它拥有数百个模型和提供商的市场,允许用户通过单一统一接口挑选最佳模型和提供商,同时提供计费、使用跟踪和规则执行等功能。
Q2:为什么企业需要AI推理路由服务?
A:随着AI应用的普及,企业每月可能消耗近10亿个Token,成本高昂。不同AI模型在成本和性能上各有优势,企业需要根据任务类型在不同模型间智能路由,以平衡成本和效果。OpenRouter提供集中式控制平面,帮助企业优化成本、延迟和能力,避免供应商锁定。
Q3:OpenRouter的业务规模有多大?
A:OpenRouter的业务量已激增至每周约25万亿Token,比六个月前的每周5万亿Token增长了五倍。该平台目前支持超过800万全球用户,包括AI原生初创公司和大型企业,其使用情况和模型排名数据已成为AI行业广泛参考的信号。
好文章,需要你的鼓励
Workday对话式AI平台Sana正式扩展至IT服务管理(ITSM)自动化领域,旨在帮助企业整合HR、财务与IT工作流程。新功能可自动处理员工入职/离职、权限变更及日常IT请求,同时新增"差旅助手"支持行程规划与费用管理。分析师指出,跨部门工作流统一将为CIO带来效率优势,但也警告需警惕供应商锁定风险,且在成熟ITSM市场中面临ServiceNow等强劲竞争。Sana ITSM功能预计2026年下半年开放早期使用。
论文研究了神经网络训练中激活函数与损失函数的结构性交互导致的负权重漂移现象,分析了其引发激活稀疏性的机制,并探讨了稀疏度与模型性能的量化关系及优化激活函数的选择。
美国超过75,000台风力涡轮机正陆续迈入服役15至20年的生命周期末段,风电"翻新改造"(Repowering)正成为行业发展的核心战略。通过替换老旧组件或整机,结合现有基础设施、并网资源与土地权益,改造项目可显著提升年发电量、延长运营寿命并降低资本支出。文章从组件兼容性、选址条件、电网接入、环保审批及融资结构等维度,系统梳理了改造可行性评估的关键要素,为风电资产现代化提供决策参考。
MetaAgent-X是一个端到端强化学习框架,首次同步训练AI多智能体系统中的设计者与执行者,打破执行者能力冻结的天花板,在数学和代码任务上最高提升21.7%。