欧洲最知名的AI初创公司之一发布了两个极小的AI模型,小到可以用鸡脑和蝇脑来命名。
Multiverse Computing声称这是世界上最小但仍保持高性能的模型,能够处理聊天、语音,其中一个甚至具备推理能力。
这些新的微型模型旨在嵌入物联网设备,以及在智能手机、平板电脑和个人电脑上本地运行。
"我们可以将模型压缩到足以装入设备中,"创始人Román Orús对TechCrunch表示。"你可以在本地运行它们,直接在iPhone上,甚至在Apple Watch上。"
据我们此前报道,Multiverse Computing是一家备受瞩目的欧洲AI初创公司,总部位于西班牙多诺斯蒂亚,在全球设有办公室,约有100名员工。该公司由欧洲顶级量子计算和物理学教授Román Orús、量子计算专家Samuel Mugel和前Unnim银行副首席执行官Enrique Lizaso Olmos共同创立。
该公司刚刚在6月融资1.89亿欧元(约2.15亿美元),凭借其称为"CompactifAI"的模型压缩技术获得投资。Orús表示,自2019年成立以来,公司已累计融资约2.5亿美元。
CompactifAI是一种量子启发的压缩算法,能够在不牺牲性能的情况下缩小现有AI模型的大小。
"我们拥有的压缩技术不是计算机科学或机器学习领域的典型压缩技术,因为我们来自量子物理学背景,"他解释道。"这是一种更精妙、更精致的压缩算法。"
该公司已经发布了一长串开源模型的压缩版本,特别是流行的小型模型如Llama 4 Scout或Mistral Small 3.1。它还刚刚推出了OpenAI两个新开源模型的压缩版本。该公司还压缩了一些超大型模型——例如提供DeepSeek R1 Slim版本。
由于专注于让模型变得更小,该公司特别关注制造尽可能小而强大的模型。
其两个新模型非常小,几乎可以为任何物联网设备带来聊天AI功能,并且无需互联网连接即可工作。该公司幽默地将这个系列称为模型动物园,因为它根据动物大脑尺寸来命名产品。
一个名为SuperFly的模型是Hugging Face开源模型SmolLM2-135的压缩版本。原始模型有1.35亿参数,专为设备端使用而开发。SuperFly有9400万参数,Orús将其比作蝇脑的大小。"这就像拥有一只苍蝇,但稍微聪明一点,"他说。
SuperFly设计用于在非常受限的数据上训练,比如设备操作。Multiverse设想将其嵌入家用电器,允许用户通过语音命令操作,比如对洗衣机说"开始快洗"。或者用户可以询问故障排除问题。只需一点处理能力(如Arduino),该模型就能处理语音界面,公司向TechCrunch展示了现场演示。
另一个模型名为ChickBrain,参数量更大,达32亿,但功能也更强大,具备推理能力。Multiverse表示,这是Meta的Llama 3.1 8B模型的压缩版本。但它足够小,可以在MacBook上运行,无需互联网连接。
更重要的是,Orús表示ChickBrain在几个标准基准测试中实际上略优于原始模型,包括语言技能基准MMLU-Pro、数学技能基准Math 500和GSM8K,以及通用知识基准GPQA Diamond。
值得注意的是,Multiverse并未声称其模型动物园会在这些基准测试中击败最大的最先进模型。动物园的性能甚至可能无法登上排行榜。重点是其技术可以在不影响性能的情况下缩小模型尺寸。
Orús表示,该公司已经与所有领先的设备和电器制造商进行谈判。"我们正在与苹果对话。我们正在与三星、索尼和惠普对话,惠普显然作为投资者参与了上一轮融资,"他说。本轮融资由知名欧洲风投公司Bullhound Capital领投,包括HP Tech Ventures和东芝在内的多家机构参与。
这家初创公司还为其他形式的机器学习提供压缩技术,如图像识别,在六年中已获得巴斯夫、Ally、穆迪、博世等客户。
除了直接向主要设备制造商销售模型外,Multiverse还通过托管在AWS上的API提供其压缩模型,任何开发者都可以使用,通常Token费用比竞争对手更低。
Q&A
Q1:CompactifAI压缩技术有什么特别之处?
A:CompactifAI是一种量子启发的压缩算法,与传统的计算机科学或机器学习压缩技术不同。由于Multiverse团队来自量子物理学背景,这是一种更精妙、更精致的压缩算法,能够在不牺牲性能的情况下大幅缩小AI模型尺寸。
Q2:SuperFly和ChickBrain模型能用在哪些场景?
A:SuperFly有9400万参数,可嵌入家用电器,让用户通过语音命令操作,如对洗衣机说"开始快洗"或询问故障排除问题。ChickBrain有32亿参数,具备推理能力,可在MacBook等设备上本地运行,无需互联网连接。
Q3:Multiverse Computing已经与哪些公司合作?
A:该公司已与多家知名企业建立合作关系,包括巴斯夫、Ally、穆迪、博世等客户。目前正与苹果、三星、索尼、惠普等设备制造商进行谈判,惠普还作为投资者参与了最新一轮融资。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。