人工智能初创公司Liquid AI Inc.今日宣布在AI训练和定制方面取得突破性进展,推出名为"Nanos"的超小型模型,能够在专门任务上提供OpenAI GPT-4o级别的性能。
这些新模型的参数规模在3.5亿到26亿之间,足够小巧,可以直接在手机、笔记本电脑和嵌入式设备上本地运行。小型紧凑的前沿大语言模型使用户能够直接在设备上执行AI任务,无需云端支持。通过在本地处理所有AI推理,用户可以享受AI驱动的洞察和对话功能,同时确保隐私安全。
Liquid AI首席执行官Ramin Hasani表示:"Nanos颠覆了部署模式。我们不是将每个Token发送到数据中心,而是将智能传送到设备上。这解锁了速度、隐私、弹性和最终可扩展到每个人的成本结构。"
据Liquid介绍,尽管Nanos体积微小,但在可靠性方面接近前沿水平,为设备端智能体AI功能提供基础,具备精确数据提取、结构化输出生成、10多种语言的多语言转换、检索增强生成(RAG)支持、数学推理和工具调用等能力。
公司在首次发布中推出七款任务专用Nanos模型,计划扩展产品系列。其中包括LFM2-350M-ENJP-MT,这是一个可在智能手机上运行的日英翻译模型,以及LFM-350M-Extract,一个多语言数据提取模型,可从发票邮件中提取信息并格式化为JSON数据结构。
Liquid表示,这两个3.5亿参数模型的质量超越了比它们大10倍以上的通用开源模型。LFM2-350M-ENJP-MT在日英翻译方面的表现与GPT-4o相当,而后者估计比前者大500多倍。
公司使用广泛的文本训练了这个日语翻译模型,包括聊天消息、多段新闻文章、技术论文和正式写作。Liquid指出,该模型在公共llm-jp-eval基准测试上进行了评估,该基准主要包含维基百科一到两句文章的简短翻译和单句新闻项目。
在12亿参数规模下,公司发布了提取模型、基于大量信息使用RAG技术回答问题的模型,以及函数调用模型。
在一个例子中,Nano LFM2-1.2B-Extract作为350M模型的大型版本,可以用不同语言输出复杂数据对象,性能优于Google的Gemma 3 27B(比其大20多倍的模型),与GPT-4o性能相当。同时它足够小巧,可在大多数当前一代智能手机上运行。
Liquid表示,通过开发超小型、高性能的任务专用模型,为设备上运行的智能体提供支持网络。应用程序可以将特定任务需求外包给更小、更节能的模型,而不是依赖单一的高功率通用AI来支持智能和自动化。
首席技术官Mathias Lechner表示:"Liquid Nanos以零边际推理成本提供大型前沿模型的任务专用性能。我们的企业客户已成功将Liquid Nanos部署在从大规模高吞吐量云实例到低功耗嵌入式设备完全本地运行的各种场景中。"
Liquid的模型基于"液体神经网络"概念构建的专门架构,这是一种不同于生成式预训练Transformer模型(GPT)的AI网络分类,后者是当今ChatGPT和Gemini等流行聊天机器人的基础。公司声明,这种架构使其模型能够提供与市场上现有传统大语言模型相当甚至更好的性能。
AMD公司首席技术官兼执行副总裁Mark Papermaster表示:"Liquid的Nanos代表了AI PC的强大拐点,以紧凑、节能的形式提供前沿级性能。"他补充说,AMD认为设备端智能是可持续地大规模推广AI的关键。由于设备端AI模型不需要耗电的数据中心来执行,在智能手机、笔记本电脑和PC上进行的处理越多,整体能耗就越少。
公司表示,Liquid Nanos现已在Liquid边缘AI平台LEAP上提供下载,可集成到iOS和Android手机及笔记本电脑。开发者也可以在Hugging Face上访问这些新模型,并通过面向学者、开发者和小企业的广泛许可证直接使用。
Q&A
Q1:Liquid AI的Nanos模型有什么特殊之处?
A:Nanos是超小型AI模型,参数规模在3.5亿到26亿之间,但能提供OpenAI GPT-4o级别的性能。最大特点是可以直接在手机、笔记本等设备上本地运行,无需云端支持,既保护隐私又提供快速响应。
Q2:Nanos模型能完成哪些具体任务?
A:Nanos具备多项能力,包括精确数据提取、结构化输出生成、10多种语言翻译、检索增强生成支持、数学推理和工具调用等。例如LFM2-350M-ENJP-MT可进行日英翻译,LFM-350M-Extract能从发票邮件提取信息并格式化为JSON。
Q3:开发者如何获取和使用Nanos模型?
A:开发者可通过Liquid边缘AI平台LEAP下载Nanos模型,集成到iOS和Android设备。也可在Hugging Face平台直接访问这些模型,公司为学者、开发者和小企业提供了广泛的使用许可证。
好文章,需要你的鼓励
英国宠物慈善机构PDSA数据显示,超过半数宠物主担心无法承担兽医费用。科技公司正通过AI和物联网技术解决这一市场需求。在伦敦兽医展上,多家初创公司展示了创新技术:AI for Pet利用视觉AI分析宠物眼部、皮肤等图像提供健康洞察;Sylvester.ai开发AI模型识别猫咪疼痛表情;VEA整合患者数据自动化诊断。此外,智能项圈等物联网设备可追踪宠物健康症状。这些技术有助于宠物主采取预防措施,降低兽医费用。
蚂蚁集团等机构联合提出IGPO方法,解决多轮AI智能体训练中的奖励稀疏问题。该方法通过信息增益为每个交互轮次提供密集反馈,避免传统方法中的"优势坍塌"现象。在七个数据集上的实验表明,IGPO显著超越现有方法,平均提升4.8分,对小型模型改进尤为显著。该研究为多轮推理AI训练提供了新思路。
北欧国家启动统一人工智能产业计划,旨在通过合作在全球舞台上竞争,获得微软和谷歌支持。10月成立的新北欧AI中心获得350万英镑初始预算,但谷歌和微软是唯一提供资金支持的科技公司,具体金额保密。该中心将开发生成式AI系统并建设应用AI服务的系统。北欧教育部长承诺追加资金开发大型北欧语言生成AI模型。尽管资金有限,但北欧国家希望通过联合力量在AI竞赛中提升地位。
ETH苏黎世大学和Google联合开发的VIST3A技术,通过巧妙拼接视频生成模型和3D重建模型,实现了仅用文字描述就能生成高质量3D场景的突破。该技术采用模型拼接和直接奖励微调两大核心创新,在多个基准测试中显著超越现有方法,为3D内容创作的民主化开辟了新路径,有望推动游戏、教育、设计等领域的变革。