欧洲最知名的AI初创公司之一发布了两个极小的AI模型,小到可以用鸡脑和蝇脑来命名。
Multiverse Computing声称这是世界上最小但仍保持高性能的模型,能够处理聊天、语音,其中一个甚至具备推理能力。
这些新的微型模型旨在嵌入物联网设备,以及在智能手机、平板电脑和个人电脑上本地运行。
"我们可以将模型压缩到足以装入设备中,"创始人Román Orús对TechCrunch表示。"你可以在本地运行它们,直接在iPhone上,甚至在Apple Watch上。"
据我们此前报道,Multiverse Computing是一家备受瞩目的欧洲AI初创公司,总部位于西班牙多诺斯蒂亚,在全球设有办公室,约有100名员工。该公司由欧洲顶级量子计算和物理学教授Román Orús、量子计算专家Samuel Mugel和前Unnim银行副首席执行官Enrique Lizaso Olmos共同创立。
该公司刚刚在6月融资1.89亿欧元(约2.15亿美元),凭借其称为"CompactifAI"的模型压缩技术获得投资。Orús表示,自2019年成立以来,公司已累计融资约2.5亿美元。
CompactifAI是一种量子启发的压缩算法,能够在不牺牲性能的情况下缩小现有AI模型的大小。
"我们拥有的压缩技术不是计算机科学或机器学习领域的典型压缩技术,因为我们来自量子物理学背景,"他解释道。"这是一种更精妙、更精致的压缩算法。"
该公司已经发布了一长串开源模型的压缩版本,特别是流行的小型模型如Llama 4 Scout或Mistral Small 3.1。它还刚刚推出了OpenAI两个新开源模型的压缩版本。该公司还压缩了一些超大型模型——例如提供DeepSeek R1 Slim版本。
由于专注于让模型变得更小,该公司特别关注制造尽可能小而强大的模型。
其两个新模型非常小,几乎可以为任何物联网设备带来聊天AI功能,并且无需互联网连接即可工作。该公司幽默地将这个系列称为模型动物园,因为它根据动物大脑尺寸来命名产品。
一个名为SuperFly的模型是Hugging Face开源模型SmolLM2-135的压缩版本。原始模型有1.35亿参数,专为设备端使用而开发。SuperFly有9400万参数,Orús将其比作蝇脑的大小。"这就像拥有一只苍蝇,但稍微聪明一点,"他说。
SuperFly设计用于在非常受限的数据上训练,比如设备操作。Multiverse设想将其嵌入家用电器,允许用户通过语音命令操作,比如对洗衣机说"开始快洗"。或者用户可以询问故障排除问题。只需一点处理能力(如Arduino),该模型就能处理语音界面,公司向TechCrunch展示了现场演示。
另一个模型名为ChickBrain,参数量更大,达32亿,但功能也更强大,具备推理能力。Multiverse表示,这是Meta的Llama 3.1 8B模型的压缩版本。但它足够小,可以在MacBook上运行,无需互联网连接。
更重要的是,Orús表示ChickBrain在几个标准基准测试中实际上略优于原始模型,包括语言技能基准MMLU-Pro、数学技能基准Math 500和GSM8K,以及通用知识基准GPQA Diamond。
值得注意的是,Multiverse并未声称其模型动物园会在这些基准测试中击败最大的最先进模型。动物园的性能甚至可能无法登上排行榜。重点是其技术可以在不影响性能的情况下缩小模型尺寸。
Orús表示,该公司已经与所有领先的设备和电器制造商进行谈判。"我们正在与苹果对话。我们正在与三星、索尼和惠普对话,惠普显然作为投资者参与了上一轮融资,"他说。本轮融资由知名欧洲风投公司Bullhound Capital领投,包括HP Tech Ventures和东芝在内的多家机构参与。
这家初创公司还为其他形式的机器学习提供压缩技术,如图像识别,在六年中已获得巴斯夫、Ally、穆迪、博世等客户。
除了直接向主要设备制造商销售模型外,Multiverse还通过托管在AWS上的API提供其压缩模型,任何开发者都可以使用,通常Token费用比竞争对手更低。
Q&A
Q1:CompactifAI压缩技术有什么特别之处?
A:CompactifAI是一种量子启发的压缩算法,与传统的计算机科学或机器学习压缩技术不同。由于Multiverse团队来自量子物理学背景,这是一种更精妙、更精致的压缩算法,能够在不牺牲性能的情况下大幅缩小AI模型尺寸。
Q2:SuperFly和ChickBrain模型能用在哪些场景?
A:SuperFly有9400万参数,可嵌入家用电器,让用户通过语音命令操作,如对洗衣机说"开始快洗"或询问故障排除问题。ChickBrain有32亿参数,具备推理能力,可在MacBook等设备上本地运行,无需互联网连接。
Q3:Multiverse Computing已经与哪些公司合作?
A:该公司已与多家知名企业建立合作关系,包括巴斯夫、Ally、穆迪、博世等客户。目前正与苹果、三星、索尼、惠普等设备制造商进行谈判,惠普还作为投资者参与了最新一轮融资。
好文章,需要你的鼓励
Gartner预测,到2030年所有IT工作都将涉及AI技术的使用,这与目前81%的IT工作不使用AI形成鲜明对比。届时25%的IT工作将完全由机器人执行,75%由人类在AI辅助下完成。尽管AI将取代部分入门级IT职位,但Gartner认为不会出现大规模失业潮,目前仅1%的失业由AI造成。研究显示65%的公司在AI投资上亏损,而世界经济论坛预计AI到2030年创造的就业机会将比消除的多7800万个。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。
人工智能正从软件故事转向AI工厂基础,芯片、数据管道和网络协同工作形成数字化生产系统。这种新兴模式重新定义了性能衡量标准和跨行业价值创造方式。AI工厂将定制半导体、低延迟结构和大规模数据仪器整合为实时反馈循环,产生竞争优势。博通、英伟达和IBM正在引领这一转变,通过长期定制芯片合同和企业遥测技术,将传统体验转化为活跃的数字生态系统。
韩国成均馆大学研究团队开发了首个机器遗忘可视化评估系统Unlearning Comparator,解决了AI"选择性失忆"技术缺乏标准化评估的问题。系统通过直观界面帮助研究人员深入比较不同遗忘方法,并基于分析洞察开发出性能优异的引导遗忘新方法,为构建更负责任的AI系统提供重要工具支持。