欧洲最知名的AI初创公司之一发布了两个极小的AI模型,小到可以用鸡脑和蝇脑来命名。
Multiverse Computing声称这是世界上最小但仍保持高性能的模型,能够处理聊天、语音,其中一个甚至具备推理能力。
这些新的微型模型旨在嵌入物联网设备,以及在智能手机、平板电脑和个人电脑上本地运行。
"我们可以将模型压缩到足以装入设备中,"创始人Román Orús对TechCrunch表示。"你可以在本地运行它们,直接在iPhone上,甚至在Apple Watch上。"
据我们此前报道,Multiverse Computing是一家备受瞩目的欧洲AI初创公司,总部位于西班牙多诺斯蒂亚,在全球设有办公室,约有100名员工。该公司由欧洲顶级量子计算和物理学教授Román Orús、量子计算专家Samuel Mugel和前Unnim银行副首席执行官Enrique Lizaso Olmos共同创立。
该公司刚刚在6月融资1.89亿欧元(约2.15亿美元),凭借其称为"CompactifAI"的模型压缩技术获得投资。Orús表示,自2019年成立以来,公司已累计融资约2.5亿美元。
CompactifAI是一种量子启发的压缩算法,能够在不牺牲性能的情况下缩小现有AI模型的大小。
"我们拥有的压缩技术不是计算机科学或机器学习领域的典型压缩技术,因为我们来自量子物理学背景,"他解释道。"这是一种更精妙、更精致的压缩算法。"
该公司已经发布了一长串开源模型的压缩版本,特别是流行的小型模型如Llama 4 Scout或Mistral Small 3.1。它还刚刚推出了OpenAI两个新开源模型的压缩版本。该公司还压缩了一些超大型模型——例如提供DeepSeek R1 Slim版本。
由于专注于让模型变得更小,该公司特别关注制造尽可能小而强大的模型。
其两个新模型非常小,几乎可以为任何物联网设备带来聊天AI功能,并且无需互联网连接即可工作。该公司幽默地将这个系列称为模型动物园,因为它根据动物大脑尺寸来命名产品。
一个名为SuperFly的模型是Hugging Face开源模型SmolLM2-135的压缩版本。原始模型有1.35亿参数,专为设备端使用而开发。SuperFly有9400万参数,Orús将其比作蝇脑的大小。"这就像拥有一只苍蝇,但稍微聪明一点,"他说。
SuperFly设计用于在非常受限的数据上训练,比如设备操作。Multiverse设想将其嵌入家用电器,允许用户通过语音命令操作,比如对洗衣机说"开始快洗"。或者用户可以询问故障排除问题。只需一点处理能力(如Arduino),该模型就能处理语音界面,公司向TechCrunch展示了现场演示。
另一个模型名为ChickBrain,参数量更大,达32亿,但功能也更强大,具备推理能力。Multiverse表示,这是Meta的Llama 3.1 8B模型的压缩版本。但它足够小,可以在MacBook上运行,无需互联网连接。
更重要的是,Orús表示ChickBrain在几个标准基准测试中实际上略优于原始模型,包括语言技能基准MMLU-Pro、数学技能基准Math 500和GSM8K,以及通用知识基准GPQA Diamond。
值得注意的是,Multiverse并未声称其模型动物园会在这些基准测试中击败最大的最先进模型。动物园的性能甚至可能无法登上排行榜。重点是其技术可以在不影响性能的情况下缩小模型尺寸。
Orús表示,该公司已经与所有领先的设备和电器制造商进行谈判。"我们正在与苹果对话。我们正在与三星、索尼和惠普对话,惠普显然作为投资者参与了上一轮融资,"他说。本轮融资由知名欧洲风投公司Bullhound Capital领投,包括HP Tech Ventures和东芝在内的多家机构参与。
这家初创公司还为其他形式的机器学习提供压缩技术,如图像识别,在六年中已获得巴斯夫、Ally、穆迪、博世等客户。
除了直接向主要设备制造商销售模型外,Multiverse还通过托管在AWS上的API提供其压缩模型,任何开发者都可以使用,通常Token费用比竞争对手更低。
Q&A
Q1:CompactifAI压缩技术有什么特别之处?
A:CompactifAI是一种量子启发的压缩算法,与传统的计算机科学或机器学习压缩技术不同。由于Multiverse团队来自量子物理学背景,这是一种更精妙、更精致的压缩算法,能够在不牺牲性能的情况下大幅缩小AI模型尺寸。
Q2:SuperFly和ChickBrain模型能用在哪些场景?
A:SuperFly有9400万参数,可嵌入家用电器,让用户通过语音命令操作,如对洗衣机说"开始快洗"或询问故障排除问题。ChickBrain有32亿参数,具备推理能力,可在MacBook等设备上本地运行,无需互联网连接。
Q3:Multiverse Computing已经与哪些公司合作?
A:该公司已与多家知名企业建立合作关系,包括巴斯夫、Ally、穆迪、博世等客户。目前正与苹果、三星、索尼、惠普等设备制造商进行谈判,惠普还作为投资者参与了最新一轮融资。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。