欧洲最知名的AI初创公司之一发布了两个极小的AI模型,小到可以用鸡脑和蝇脑来命名。
Multiverse Computing声称这是世界上最小但仍保持高性能的模型,能够处理聊天、语音,其中一个甚至具备推理能力。
这些新的微型模型旨在嵌入物联网设备,以及在智能手机、平板电脑和个人电脑上本地运行。
"我们可以将模型压缩到足以装入设备中,"创始人Román Orús对TechCrunch表示。"你可以在本地运行它们,直接在iPhone上,甚至在Apple Watch上。"
据我们此前报道,Multiverse Computing是一家备受瞩目的欧洲AI初创公司,总部位于西班牙多诺斯蒂亚,在全球设有办公室,约有100名员工。该公司由欧洲顶级量子计算和物理学教授Román Orús、量子计算专家Samuel Mugel和前Unnim银行副首席执行官Enrique Lizaso Olmos共同创立。
该公司刚刚在6月融资1.89亿欧元(约2.15亿美元),凭借其称为"CompactifAI"的模型压缩技术获得投资。Orús表示,自2019年成立以来,公司已累计融资约2.5亿美元。
CompactifAI是一种量子启发的压缩算法,能够在不牺牲性能的情况下缩小现有AI模型的大小。
"我们拥有的压缩技术不是计算机科学或机器学习领域的典型压缩技术,因为我们来自量子物理学背景,"他解释道。"这是一种更精妙、更精致的压缩算法。"
该公司已经发布了一长串开源模型的压缩版本,特别是流行的小型模型如Llama 4 Scout或Mistral Small 3.1。它还刚刚推出了OpenAI两个新开源模型的压缩版本。该公司还压缩了一些超大型模型——例如提供DeepSeek R1 Slim版本。
由于专注于让模型变得更小,该公司特别关注制造尽可能小而强大的模型。
其两个新模型非常小,几乎可以为任何物联网设备带来聊天AI功能,并且无需互联网连接即可工作。该公司幽默地将这个系列称为模型动物园,因为它根据动物大脑尺寸来命名产品。
一个名为SuperFly的模型是Hugging Face开源模型SmolLM2-135的压缩版本。原始模型有1.35亿参数,专为设备端使用而开发。SuperFly有9400万参数,Orús将其比作蝇脑的大小。"这就像拥有一只苍蝇,但稍微聪明一点,"他说。
SuperFly设计用于在非常受限的数据上训练,比如设备操作。Multiverse设想将其嵌入家用电器,允许用户通过语音命令操作,比如对洗衣机说"开始快洗"。或者用户可以询问故障排除问题。只需一点处理能力(如Arduino),该模型就能处理语音界面,公司向TechCrunch展示了现场演示。
另一个模型名为ChickBrain,参数量更大,达32亿,但功能也更强大,具备推理能力。Multiverse表示,这是Meta的Llama 3.1 8B模型的压缩版本。但它足够小,可以在MacBook上运行,无需互联网连接。
更重要的是,Orús表示ChickBrain在几个标准基准测试中实际上略优于原始模型,包括语言技能基准MMLU-Pro、数学技能基准Math 500和GSM8K,以及通用知识基准GPQA Diamond。
值得注意的是,Multiverse并未声称其模型动物园会在这些基准测试中击败最大的最先进模型。动物园的性能甚至可能无法登上排行榜。重点是其技术可以在不影响性能的情况下缩小模型尺寸。
Orús表示,该公司已经与所有领先的设备和电器制造商进行谈判。"我们正在与苹果对话。我们正在与三星、索尼和惠普对话,惠普显然作为投资者参与了上一轮融资,"他说。本轮融资由知名欧洲风投公司Bullhound Capital领投,包括HP Tech Ventures和东芝在内的多家机构参与。
这家初创公司还为其他形式的机器学习提供压缩技术,如图像识别,在六年中已获得巴斯夫、Ally、穆迪、博世等客户。
除了直接向主要设备制造商销售模型外,Multiverse还通过托管在AWS上的API提供其压缩模型,任何开发者都可以使用,通常Token费用比竞争对手更低。
Q&A
Q1:CompactifAI压缩技术有什么特别之处?
A:CompactifAI是一种量子启发的压缩算法,与传统的计算机科学或机器学习压缩技术不同。由于Multiverse团队来自量子物理学背景,这是一种更精妙、更精致的压缩算法,能够在不牺牲性能的情况下大幅缩小AI模型尺寸。
Q2:SuperFly和ChickBrain模型能用在哪些场景?
A:SuperFly有9400万参数,可嵌入家用电器,让用户通过语音命令操作,如对洗衣机说"开始快洗"或询问故障排除问题。ChickBrain有32亿参数,具备推理能力,可在MacBook等设备上本地运行,无需互联网连接。
Q3:Multiverse Computing已经与哪些公司合作?
A:该公司已与多家知名企业建立合作关系,包括巴斯夫、Ally、穆迪、博世等客户。目前正与苹果、三星、索尼、惠普等设备制造商进行谈判,惠普还作为投资者参与了最新一轮融资。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。