随着企业领导者采用生成式人工智能,他们必须决定是使用开源模型构建AI能力,还是依赖专有的闭源替代方案。理解这一选择的影响可能是获得可持续竞争优势与战略失误之间的关键差异。
但什么是真正的"开源"?
根据开源倡议组织(OSI)的定义,软件要被视为开源,必须为用户提供以下自由:将软件用于任何目的、研究其工作原理、修改软件,以及分享原始版本和修改版本。当应用于AI时,真正的开源AI包括模型架构(AI处理数据的蓝图)、训练数据配方(记录数据如何被选择和用于训练模型)以及权重(代表AI学习知识的数值)。
但根据OSI定义,很少有AI模型是真正开源的。
开放性的梯度
虽然完全开源的模型提供完全透明度,但很少有模型开发者愿意公布其完整源代码,更少有人对其模型训练数据保持透明。许多所谓的基础模型——最大的生成式AI模型——都是在版权最好说是模糊、最坏说是明显侵权的数据上训练的。
更常见的是开放权重系统,它们提供对模型权重的公共访问,但不披露完整的训练数据或架构。这允许更快的部署和实验,资源需求较少,但在没有完全透明度的情况下,限制了诊断偏见或提高准确性的能力。
一些公司采用阶段性开放模型。他们可能在继任者推出后发布专有模型的旧版本,提供对架构的有限洞察,同时限制对最新创新的访问。即使在这里,训练数据也很少被披露。
导航梯度
决定企业是否要利用像GPT-4o这样的专有模型,或某种程度的开放性,如LlaMA 3.3,当然取决于用例。许多组织最终会混合使用开放和封闭模型。
主要决策是模型将驻留在哪里。对于像银行这样的受监管行业,由于监管约束,数据不能离开场所,开源模型是唯一可行的选择。因为专有模型所有者需要保护其知识产权,这些模型只能通过应用程序编程接口(API)远程访问。
开源模型可以部署在公司场所或云中。
开放和封闭模型都可以针对特定用例进行微调,但开源模型提供更多灵活性并允许更深入的定制。同样,微调中使用的数据不需要离开公司的硬件。微调专有模型需要较少的专业知识,但必须在云中完成。
尽管如此,成本和延迟可能会使天平倾向于专有AI。专有提供商通常运营大规模基础设施,旨在确保快速响应时间和可预测的性能,特别是在每天处理数百万查询的聊天机器人或虚拟助手等消费者应用中。
开源AI虽然从长远来看运营成本更低,但需要在基础设施和专业知识方面进行重大投资,以实现类似的延迟和正常运行时间。
导航监管环境是部署AI的公司的另一个关注点。欧盟的人工智能法案为专有AI模型设定了更严格的透明度和问责标准。然而,专有提供商通常承担更大的合规责任,减少了企业的监管负担。在美国,国家电信和信息管理局(NTIA)正在考虑通过基于风险的视角评估AI开放性的指导方针。
当然,一个主要考虑因素是安全性。通过使用专有模型,公司将信任置于提供商,相信模型是安全的。但这种不透明性可能隐藏漏洞,使公司依赖供应商来披露和解决威胁。
另一方面,开源模型受益于全球安全研究社区,能够快速检测和修补漏洞。
尽管如此,企业通常更喜欢API访问专有模型的便利性,以进行快速原型制作。对于面向消费者的应用,专有模型快速且易于集成到产品中。
开源会超越专有模型吗?
但一个更大的问题笼罩在闭源和开源的未来。随着开源模型性能的提高,缩小与最佳专有模型性能的差距甚至超越它们,闭源模型和提供它们的公司的财务可行性仍然不确定。
中国正在推行激进的开源策略,降低其模型成本以抢夺OpenAI等公司的市场份额。通过公开发布其研究、代码和模型,中国希望以西方专有解决方案成本的一小部分使先进AI变得可及。
企业领导者的关键要点
记住Betamax,这是20世纪70年代日本索尼开发并严格控制的专有录像带格式。它败给了更开放的VHS格式,原因与许多人认为闭源AI模型最终会被开源AI超越的原因相同。
领导者必须定义他们想通过AI实现什么,无论是效率、创新、风险降低还是合规性,并让这些目标指导他们的模型选择和部署策略。例如,他们可以利用开源社区进行创新和快速原型制作,同时依赖专有解决方案处理关键任务、高安全性应用。
与外部合作伙伴协作,并根据需要利用开源和专有模型,将使组织能够负责任地创新并保持竞争力。
关键是领导者要了解其独特的运营需求、数据敏感性和技术能力——然后相应地选择。但在开源和专有AI模型之间选择与其说是二元决策,不如说是在从封闭到完全开放的连续体上找到最优模型。
好文章,需要你的鼓励
法国AI初创公司Mistral AI发布了首个大语言模型全面生命周期评估,量化了AI的环境代价。其Mistral Large 2模型训练产生20,400吨二氧化碳当量,消耗281,000立方米水。运营阶段占环境影响85%,远超硬件制造成本。研究表明地理位置和模型大小显著影响碳足迹,企业可通过选择适当规模模型、批处理技术和清洁能源部署来减少环境影响。这一透明度为企业AI采购决策提供了新的评估标准。
上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互娱乐领域提供了全新的技术路径。
许多人认为一旦实现通用人工智能(AGI)和人工智能超级智能(ASI),这些高度先进的AI将能够告诉我们人生的真正意义。然而,巅峰AI可能无法明确回答这个史诗般的问题。即使AI拥有人类所有知识,也不意味着能从中找到生命意义的答案。AI可能会选择提供多种可能性而非绝对答案,以避免分裂人类社会。
上海AI实验室研究团队开发了革命性的AI编程验证方法,让大语言模型能够在最小人工干预下自动生成和验证程序规范。该方法摒弃传统的人工标注训练,采用强化学习让模型在形式化语言空间中自主探索,在Dafny编程验证任务上显著超越现有方法,为AI自主学习开辟新道路。