大语言模型面临一个问题:它们太大了。西班牙初创公司Multiverse Computing正在通过压缩模型来解决这个问题,旨在缩小前沿模型功能与企业实际部署能力之间的差距。
秘密武器是CompactifAI压缩技术
其核心技术是CompactifAI,这是一项受量子计算启发的压缩技术,这家巴斯克公司将其应用于OpenAI发布的模型。从今日起,开发者可以在Hugging Face上免费访问Multiverse的HyperNova 60B模型的新版本。该公司还计划在2026年开源更多压缩模型,以支持更广泛的用例。
据Multiverse介绍,其模型更小,但几乎同样强大和准确。HyperNova 60B仅为32GB,大约是其源模型OpenAI的gpt-oss-120b的一半大小,同时拥有更低的内存使用量和更低的延迟。更新版本名为HyperNova 60B 2602,现在还更好地支持工具调用和智能体编程,这些场景的推理成本通常较高。
欧洲AI公司的竞争与合作
Multiverse声称HyperNova 60B击败的竞争对手之一是Mistral Large 3,这是法国独角兽公司Mistral AI发布的模型之一。但除了技术竞争之外,这两家欧洲AI公司也有很多共同点。
像Mistral一样,Multiverse已经扩展到了本国之外,在美国、加拿大和整个欧洲都设有办事处。两家公司都拥有企业客户。就Multiverse而言,其客户包括伊维尔德罗拉、博世和加拿大银行。
融资传言与主权AI定位
虽然Multiverse尚未正式成为独角兽,但现在传言它正在以超过15亿欧元的估值筹集5亿欧元的新一轮融资。在与TechCrunch分享的声明中,该公司确认正在与潜在投资者就新一轮融资进行积极讨论,但补充说现阶段评论估值或融资规模还为时过早。Multiverse也拒绝对其年度经常性收入在1月份达到1亿欧元的报告发表评论。
如果得到证实,这仍然只是OpenAI 200亿美元年度经常性收入的一小部分;但与Mistral的收入相差不远,后者的年度经常性收入飙升至超过4亿美元,部分原因是对美国科技替代方案的需求不断增长。同样,Multiverse在其最新新闻稿中将自己定位为一家能够"在AI技术栈中提供主权解决方案"的公司。
这些地缘政治因素最近帮助Multiverse与西班牙东北部阿拉贡地区政府建立了合作关系。西班牙技术转型机构也参与了这家AI初创公司去年2.15亿美元的B轮融资。自成立以来,Multiverse还受益于巴斯克地区的支持——该地区很快可能迎来第一家独角兽公司。
Q&A
Q1:CompactifAI技术是什么?它有什么特别之处?
A:CompactifAI是Multiverse Computing开发的一项压缩技术,受量子计算启发。该技术能够大幅压缩大语言模型的大小,同时保持近乎相同的性能和准确性。例如,HyperNova 60B模型仅为32GB,约为源模型OpenAI gpt-oss-120b的一半大小,但拥有更低的内存使用量和延迟。
Q2:HyperNova 60B模型相比其他模型有什么优势?
A:HyperNova 60B模型的主要优势包括:体积更小(32GB),内存使用量和延迟更低,同时保持接近源模型的性能。新版本HyperNova 60B 2602还增强了对工具调用和智能体编程的支持。Multiverse声称该模型在性能上超越了法国Mistral AI的Mistral Large 3模型。
Q3:开发者如何使用Multiverse的压缩模型?
A:开发者现在可以在Hugging Face平台上免费访问Multiverse的HyperNova 60B模型新版本。该公司还计划在2026年开源更多压缩模型,以支持更广泛的用例,为开发者提供更多选择和更低的部署成本。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。