在私营公司违约率高达9.2%(多年来最高水平)的背景下,风投公司Lux Capital最近建议依赖AI的公司将其计算资源承诺以书面形式确认。Lux警告称,随着金融不稳定性在AI供应链中蔓延,仅凭握手协议是不够的。
但还有另一个完全不同的选择,那就是停止完全依赖外部计算基础设施。直接在用户设备上运行的小型AI模型——无需数据中心、无需云服务提供商、无对手方风险——正在变得足够优秀,值得考虑。Multiverse Computing正在积极推进这一方向。
这家西班牙初创公司迄今为止保持着比一些同行更低调的姿态,但随着对AI效率需求的增长,这种情况正在改变。在压缩了来自OpenAI、Meta、DeepSeek和Mistral AI等主要AI实验室的模型后,该公司推出了一款展示其压缩模型能力的应用程序和一个API门户——让开发者能够访问和使用这些模型的网关——使这些模型得到更广泛的应用。
CompactifAI应用程序与Multiverse的量子启发压缩技术同名,是一个类似ChatGPT或Mistral Le Chat的AI聊天工具。用户提问,模型回答。不同之处在于,据该公司称,Multiverse嵌入了Gilda,这是一个小到可以在本地离线运行的模型。
对于终端用户来说,这是边缘AI的体验,数据不会离开他们的设备且不需要连接。但有一个限制条件:他们的移动设备必须有足够的RAM和存储空间。如果没有——许多较旧的iPhone都不具备这种条件——应用程序会通过API切换回基于云的模型。本地和云处理之间的路由由Multiverse命名为Ash Nazg的系统自动处理,这个名字对托尔金粉丝来说很熟悉,因为它引用了《指环王》中至尊魔戒的铭文。但当应用程序路由到云端时,它在过程中失去了主要的隐私优势。
这些限制意味着CompactifAI还未完全准备好大规模客户采用,尽管这可能从来都不是目标。根据Sensor Tower的数据,该应用程序在过去一个月的下载量不到5000次。
真正的目标是企业。今天,Multiverse推出了一个自助式API门户,让开发者和企业直接访问其压缩模型——无需AWS Marketplace。
首席执行官Enrique Lizaso在一份声明中表示:"CompactifAI API门户现在为开发者提供了直接访问压缩模型的途径,具备在生产环境中运行所需的透明度和控制权。"
实时使用监控是API的关键功能之一,这并非偶然。除了在边缘部署的潜在优势外,更低的计算成本是企业考虑小型模型作为大语言模型替代方案的主要原因之一。
小型模型比以前限制更少也有所帮助。本周早些时候,Mistral推出了Mistral Small 4,更新了其小型模型系列,据说同时针对通用聊天、编程、智能体任务和推理进行了优化。这家法国公司还发布了Forge系统,让企业能够构建自定义模型,包括可以选择其用例最能容忍的权衡的小型模型。
Multiverse的最新结果也表明与大语言模型的差距正在缩小。其最新的压缩模型HyperNova 60B 2602基于gpt-oss-120b构建——这是一个底层代码公开可用的OpenAI模型。该公司声称,它现在以更低的成本提供比其派生的原始模型更快的响应,这一优势对于智能体编程工作流程特别重要,在这种工作流程中AI自主完成复杂的多步编程任务。
让模型小到能在移动设备上运行同时仍然有用是一个巨大的挑战。Apple Intelligence通过结合设备端模型和云模型来绕过这个问题。Multiverse的CompactifAI应用程序也可以通过API将请求路由到gpt-oss-120b,但其主要目标是展示像Gilda这样的本地模型及其未来替代品具有超越成本节约的优势。
对于关键领域的工作者来说,能够在本地运行且无需连接云端的模型提供了更多隐私和韧性。但更大的价值在于这可以解锁的商业用例——例如,在无人机、卫星和其他无法保证连接性的环境中嵌入AI。
该公司已经为包括加拿大银行、博世和伊贝德罗拉在内的100多家全球客户提供服务,但扩大客户群可以帮助它获得更多资金。在去年筹集了2.15亿美元的B轮融资后,据传该公司现在正在以超过15亿欧元的估值筹集5亿欧元的新一轮融资。
Q&A
Q1:CompactifAI应用程序有什么特殊功能?
A:CompactifAI是一个AI聊天工具,类似ChatGPT,但特殊之处在于它嵌入了名为Gilda的小型模型,可以在设备本地离线运行。这意味着用户数据不会离开设备且不需要网络连接,提供更好的隐私保护。不过设备需要有足够的RAM和存储空间,否则会自动切换到云端模型。
Q2:小型AI模型相比大语言模型有哪些优势?
A:小型AI模型的主要优势包括更低的计算成本、更好的隐私保护(可本地运行)、更高的韧性(无需云连接)以及无对手方风险。Multiverse的最新压缩模型HyperNova 60B 2602声称能以更低成本提供比原始模型更快的响应,特别适合智能体编程等复杂任务。
Q3:Multiverse Computing的商业模式是什么?
A:Multiverse Computing主要面向企业客户,通过自助式API门户让开发者和企业直接访问其压缩模型。该公司已为包括加拿大银行、博世和伊贝德罗拉在内的100多家全球客户提供服务。其技术特别适用于无人机、卫星等无法保证网络连接的环境中嵌入AI应用。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。