Liquid AI推出LFM2-VL模型，让智能手机拥有快速视觉AI能力

Liquid AI发布了新一代视觉语言基础模型LFM2-VL，专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构，GPU推理速度比同类模型快2倍，同时保持竞争性能。提供450M和1.6B两个版本，支持512×512原生分辨率图像处理，采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。

Liquid AI发布了LFM2-VL，这是新一代视觉-语言基础模型，专为在各种硬件设备上高效部署而设计——从智能手机、笔记本电脑到可穿戴设备和嵌入式系统。该模型承诺提供低延迟性能、高精度和实际应用的灵活性。

LFM2-VL基于该公司一个月前推出的现有LFM2架构构建，该架构被称为"市场上最快的设备端基础模型"，得益于其为每个输入实时生成"权重"或模型设置的方法（称为线性输入变化系统），将其扩展到支持文本和图像输入的多模态处理，支持可变分辨率。

据Liquid AI表示，该模型的GPU推理速度比同类视觉-语言模型快两倍，同时在常见基准测试中保持竞争性能表现。

针对不同需求的两个版本

此次发布包括两种模型规模：

LFM2-VL-450M——一个超高效模型，参数不到5亿，针对资源极度受限的环境。

LFM2-VL-1.6B——一个更强大的模型，但仍轻量化足以在单GPU和设备端部署。

两个版本都能处理高达512×512像素的原生分辨率图像，避免失真或不必要的放大。对于更大图像，系统应用非重叠分块并添加缩略图以提供全局上下文，使模型能够同时捕获精细细节和更广阔的场景。

Liquid AI背景

Liquid AI由麻省理工学院计算机科学与人工智能实验室（CSAIL）的前研究人员创立，目标是构建超越广泛使用的Transformer模型的AI架构。该公司的旗舰创新——液体基础模型（LFM），基于动力学系统、信号处理和数值线性代数原理，产生能够处理文本、视频、音频、时间序列和其他序列数据的通用AI模型。

与传统架构不同，Liquid的方法旨在使用显著更少的计算资源提供竞争性或更优的性能，允许在推理过程中实时适应，同时保持低内存需求。这使得LFM既适合大规模企业用例，也适合资源有限的边缘部署。

2025年7月，该公司通过推出Liquid Edge AI平台（LEAP）扩展了其平台策略，这是一个跨平台SDK，旨在帮助开发者更容易地在移动和嵌入式设备上直接运行小型语言模型。LEAP提供iOS和Android的操作系统无关支持，与Liquid自有模型和其他开源小型语言模型集成，内置库包含小至300MB的模型——足够小以适配现代手机的最小RAM。

速度/质量权衡和技术设计

LFM2-VL使用模块化架构，结合语言模型骨干、SigLIP2 NaFlex视觉编码器和多模态投影器。投影器包含带像素解打乱的两层MLP连接器，减少图像Token数量并提高吞吐量。

用户可以调整参数，如最大图像Token或分块数量，根据部署场景平衡速度和质量。训练过程涉及约1000亿多模态Token，来源于开放数据集和内部合成数据。

性能和基准测试

该模型在一系列视觉-语言评估中实现了竞争性基准结果。LFM2-VL-1.6B在RealWorldQA（65.23分）、InfoVQA（58.68分）和OCRBench（742分）中表现良好，在多模态推理任务中保持稳定结果。在推理测试中，当在1024×1024图像和短提示的标准工作负载上测试时，LFM2-VL在其类别中实现了最快的GPU处理时间。

许可和可用性

LFM2-VL模型现已在Hugging Face上可用，同时提供Colab中的示例微调代码。它们与Hugging Face transformers和TRL兼容。模型在定制的"LFM1.0许可证"下发布。Liquid AI描述该许可证基于Apache 2.0原则，但完整文本尚未发布。该公司表示将在某些条件下允许商业使用，对年收入超过和低于1000万美元的公司采用不同条款。

通过LFM2-VL，Liquid AI旨在让高性能多模态AI在设备端和资源有限的部署中更易获得，而不牺牲能力。

Q&A

Q1：LFM2-VL模型有什么特别之处？

A：LFM2-VL是Liquid AI发布的新一代视觉-语言基础模型，专为智能手机、笔记本电脑、可穿戴设备等各种硬件高效部署设计。它的GPU推理速度比同类模型快两倍，同时保持竞争性能，支持512×512像素原生分辨率图像处理。

Q2：LFM2-VL有哪两个版本？分别适用于什么场景？

A：LFM2-VL提供两个版本：LFM2-VL-450M是超高效模型，参数不到5亿，适用于资源极度受限环境；LFM2-VL-1.6B是更强大的模型，但仍足够轻量化，适合单GPU和设备端部署。

Q3：普通开发者如何获取使用LFM2-VL模型？

A：LFM2-VL模型现已在Hugging Face平台上提供，同时包含Colab中的示例微调代码。模型与Hugging Face transformers和TRL兼容，在定制的LFM1.0许可证下发布，允许在特定条件下商业使用。

来源：VentureBeat

0赞

好文章，需要你的鼓励

Liquid AI推出LFM2-VL模型，让智能手机拥有快速视觉AI能力

来源：VentureBeat

2025

08/13

16:03

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

Jumio用AI，在数字身份验证风暴中心重构信任坐标

谷歌为Gemini添加有限聊天个性化功能，在记忆功能方面落后于竞争对手

SAP力推Business Suite为企业AI应用的关键基础

超级智能时代后人类将面临什么挑战？

Ai2推出MolmoAct模型：在机器人AI领域挑战英伟达和谷歌

李飞飞挑战硅谷对AGI的痴迷观念

研究发现：新版大语言模型虽基准测试分数更高，但代码漏洞更严重

如何为AI探索构建数据基础设施

名企齐聚！阿里云携手牧原、UU跑腿、新开普等豫企共绘数智未来

Google Photos经典搜索功能快速恢复方法：替代Ask Photos生成式AI搜索

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: