虽然OpenAI的ChatGPT和谷歌Gemini等专有AI模型依然广受欢迎,但随着IT领导者着力推进AI定制化并控制成本,市场天平正逐渐向开源模型倾斜。
开源模型的崛起
开源模型有时也被称为"开放权重模型",作为大语言模型的替代方案,它能为决策者提供更好的内部AI使用透明度与管控能力,而这恰恰是闭源模型所欠缺的。分析师表示,这类模型还可以帮助IT领导者有效管控AI在组织内部的经济成本与合规治理。
Gartner高级分析师总监Deepak Seth将其比作一块空白画布:"你不必自己制作画布,只需在现成的画布上作画。即便你想打造自己的模型,也不需要从零开始。"
开源模型可免费下载使用,用户可以根据自身需求进行调整和部署,就像Linux操作系统一样,任何人都可以自由下载、修改和使用。
AI工具公司Jozu联合创始人兼首席运营官Jesse Williams表示,随着越来越多的应用场景涌现,开源模型正获得越来越多的关注。"开源模型更加灵活,在某些情况下能以专有模型无法胜任或无法信任的方式运作。"
值得注意的是,Williams同时强调,开源模型的走红并不意味着对大语言模型的否定:"专有模型的普及速度超过了我们所见过的任何一项技术,而且没有任何放缓的迹象。"
主流开源模型盘点
目前市面上较为流行的开源模型包括Meta的Llama、Mistral、DeepSeek和Minimax。与此同时,专有生成式AI厂商也相继推出了自家大语言模型的开源版本:谷歌发布了基于Gemini衍生的Gemma,OpenAI推出了GPT-OSS,微软则推出了Phi。
尽管这些模型可以针对企业特定需求进行微调,但它们并不公开各自的训练数据来源。
ManpowerGroup数据科学与AI解决方案负责人Max Leaming指出,与专有大语言模型相比,谷歌和OpenAI提供的开源模型训练数据量较少,智能程度可能相对有限。因此,企业需要通过实验来找到最适合的应用场景。"这个模型擅长做什么?你必须自己去摸索,因为没有哪个开源模型是真正意义上的通用模型。"
企业采用开源模型的动因
ServiceNow、微软、HubSpot和RWS等企业均表示,开源模型更易融入现有AI基础设施、能有效降低计算成本,并且对智能体AI工作流更为友好。
Gartner高级研究总监Max Goss还提到,Anthropic和OpenAI等闭源模型提供商近期频繁出现的服务中断事件,正促使CIO们重新审视供应商锁定风险,并考虑引入开源模型来增强AI的整体韧性。"目前AI竞争仍处于早期阶段,"他说,"CIO们确实需要认真考虑:AI在哪些场景下运行?如果出现故障,备选方案和应急计划是什么?"
在本地化部署场景中,开源模型因成本更低、安全性更好而备受青睐。Leaming表示:"我不需要将企业数据暴露给服务提供商,从而避免这些数据被用于训练可能服务于竞争对手的模型。"
英伟达副总裁、物理AI仿真部门负责人Rev Lebaredian在今年GTC大会前的媒体发布会上表示,开源模型还可应用于机器人领域,为机器人提供统一的通信语言。他透露,英伟达的AI机器人技术栈大部分为开源架构,"能够将整个机器人生态系统连接在一起"。
开源模型与数字主权
开源模型在欧洲及其他地区推动数字主权方面也发挥着重要作用。例如,法国将其主权AI战略押注于Mistral;阿联酋则推出了K2 Think V2,该模型由穆罕默德·本·扎耶德人工智能大学、G42公司与芯片企业Cerebras Systems联合开发。
穆罕默德·本·扎耶德人工智能大学基础模型研究所副总裁兼董事总经理Richard Morton表示,开源模型对于主权AI至关重要,它让各国能够理解、调整并掌控驱动数字基础设施的AI系统。K2 Think V2使各国具备了按照自身优先级、语言、价值观和安全需求构建AI系统的能力。Morton强调:"对我们而言,主权的核心在于对技术本身拥有实质性的掌控权。"
安全风险不容忽视
尽管开源模型备受关注,但它们也存在一定的安全风险。英国科学、创新与技术部及AI安全研究所联合发布的一项研究报告指出,恶意行为者可能通过恶意提示词入侵系统,或借助AI技术发动攻击。
该报告由深度学习先驱Yoshua Bengio主持撰写,指出存在漏洞的模型可能成为黑客入侵企业系统的突破口。"与闭源模型可由托管方统一推送修复补丁不同,开放权重模型的开发者无法保证用户一定会采用更新版本。"
Q&A
Q1:开源模型和专有大语言模型相比,主要优势是什么?
A:开源模型可以免费下载和使用,用户可根据自身需求自由调整和部署,无需依赖单一供应商,从而降低了供应商锁定风险。此外,开源模型支持本地化部署,有助于降低计算成本、提升数据安全性,企业数据不会被提供商用于训练其他模型。在灵活性上,开源模型也更容易融入现有AI基础设施,并对智能体AI工作流更加友好。
Q2:目前主流的开源AI模型有哪些?
A:目前较为流行的开源模型包括Meta的Llama、法国公司Mistral推出的同名模型、DeepSeek以及Minimax。与此同时,谷歌推出了基于Gemini的开源版本Gemma,OpenAI发布了GPT-OSS,微软则推出了Phi。阿联酋还开发了面向主权AI需求的K2 Think V2模型。
Q3:开源模型有哪些安全风险需要注意?
A:根据英国科学、创新与技术部及AI安全研究所的研究报告,开源模型面临的主要安全风险包括:恶意行为者可能通过恶意提示词入侵系统,或利用AI技术发动攻击;存在漏洞的模型可能成为黑客入侵企业系统的入口。此外,与闭源模型不同,开源模型的开发者无法强制要求用户更新到已修复漏洞的版本,这使得安全补丁的推送存在较大不确定性。
好文章,需要你的鼓励
短视频营销正成为品牌推广的重要方式,但寻找最佳片段并精准分发始终是一大难题。初创公司Clouted通过整合逾10万名自由创作者网络,结合AI技术自动完成视频剪辑与分发策略。其AI系统持续测试不同格式与渠道组合,让每次营销活动都比上一次更精准高效。该公司近日完成700万美元种子轮融资,由Slow Ventures领投,正朝着企业级营销基础设施市场迈进。
CurveBench是由四所高校联合构建的视觉拓扑推理基准,通过让AI识别嵌套闭合曲线的层次包含关系,揭示了顶尖视觉语言模型在空间结构理解上的系统性缺陷。
本月初,Anthropic宣布购买300兆瓦算力的协议,锁定位于田纳西州孟菲斯附近的Colossus 1数据中心全部产能。据悉,Anthropic将在2029年5月前每月向xAI支付12.5亿美元,协议总价值超400亿美元。该交易细节源自SpaceX向SEC提交的S-1文件。xAI此举实质上是将闲置算力变现——近期Grok用户量下滑,大量服务器空闲,xAI由此转型为"新云服务商",向竞争对手出售计算资源。
圣母大学与亚利桑那州立大学联合构建首个真实骗局对话进展预测基准PRESCAM,揭示当前AI模型识别骗局推进逻辑的核心局限。