由全球顶尖大学研究人员合作建立的人工智能实验室 Oumi PBC,今天宣布推出其所描述的全球首个"无条件开放的 AI 平台"。
该计划旨在通过提供开放访问基础模型、数据集和开发工具,打造一个协作式的 AI 研究和开发生态系统。
Oumi 表示,迄今为止,基础 AI 模型的开发主要由限制模型访问的大型科技公司主导。即使被标记为"开源"的模型往往也缺乏完全的透明度,它们提供开放权重(即训练模型的数值参数),但不提供用于训练它们的代码或数据。Oumi 表示,它试图通过提供一个确保 AI 模型和研究完全可访问、可复制且可由任何人修改的平台来改变这种现状。
"AI 需要它的 Linux 时刻,"Oumi 的联合创始人兼首席执行官 Manos Koukoumidis (如图右) 说道,他此前曾领导 Google Cloud 的 AI 计划。"要让开源取得成功,你必须提供每个人需要的工具。"
盈利与使命并重 Oumi 作为一家公益企业运营,这意味着它是一家营利性公司,但在法律上有义务在财务目标与既定的社会或环境使命之间保持平衡。该公司已获得由 Venrock Management LLC 和风险投资公司 Obvious Management Services LLC 领投的 1000 万美元种子轮融资,Plug and Play Platform Spain SL 和 Ascend Venture Capital GP LLC 也参与其中。
Oumi 平台具有可扩展性,允许研究人员使用自己的工具和工作流程,确保与各种 AI 开发方法的兼容性。它还优先考虑可复现性,这是科学研究中的关键因素。Koukoumidis 说:"我们希望确保生产和推进研究的完整流程是完全可记录和可复现的。"
Oumi 最初以 Apache 2.0 许可证下的开源存储库形式启动。开发者可将其用于研究和商业用途。虽然 Oumi 目前不提供平台的托管版本,但公司对未来推出托管服务持开放态度。
灵活且可扩展 Oumi 平台设计为在单一统一系统中支持所有主要基础模型工作流程。主要功能包括能够使用监督式微调、低秩适应、量化低秩适应和直接性能优化等高级技术来训练和微调从 1000 万到 4050 亿参数不等的模型。它可以处理文本和多模态模型,包括 Llama、Qwen 和 Phi。
该工具包支持使用大语言模型评判器合成和整理训练数据,并能够通过流行的推理引擎(如 vLLM 和 SGLang)部署模型。开发者可以根据既定的 AI 基准评估模型,并在从个人笔记本电脑到超大规模云平台的各种环境中工作。该平台与开放模型以及 OpenAI LLC、Anthropic PBC 和 Vertex Systems Oy 等商业模型开发者提供的应用程序接口集成。
Oumi 的创始人认为,目前的 AI 研究格局通过将开发限制在企业孤岛中而造成了人为的创新障碍。"我们的愿景是让 AI 成为终极团队运动,"Oumi 的联合创始人、前 Apple Inc. 机器学习工程师 Oussama Elachqar (如图左) 说。"为 AI 人才提供一个可以集体工作的平台将加速进步,并加快 AI 各个领域的发现。"
超越开放权重 该公司的首次亮相早在中国初创公司 DeepSeek 本周以远低于其他替代方案的成本开发出一个功能强大的大语言模型之前就已计划好了。
Koukoumidis 指出,DeepSeek 以开放权重许可发布其模型,提供了 AI 模型的训练参数,但不包括完整的源代码、训练数据或方法论。
"Oumi 的目标是使社区能够构建下一个真正开放的 DeepSeek,然后是后续版本,"他在书面评论中说。"DeepSeek 的成就表明,解决 AI 开发挑战并不像受计算能力限制那样,而是更多地受人才限制,当前的 AI 格局造成了一种虚假的稀缺感。"他说,一个完全开放的平台可以利用规模经济来提高效率。
来自伊利诺伊大学香槟分校、卡内基梅隆大学、普林斯顿大学、加州理工学院、加州大学伯克利分校、华盛顿大学、纽约大学、麻省理工学院、滑铁卢大学、剑桥大学和牛津大学的 AI 研究人员正在开发该平台。Oumi 表示计划促进完全开放参与的协调研究工作。
Oumi 邀请有兴趣贡献或使用该平台的研究人员访问公司网站或 GitHub 页面了解更多信息。
好文章,需要你的鼓励
本文揭示了AI时代CIO的七项关键行为特征,基于对多位CIO和AI专家的深度访谈。专家指出,AI精通的CIO需具备实用AI素养、战略视野和变革领导力,能将技术与业务战略对齐,建立强大数据治理基础。文章详细解析了分析型AI、生成式AI和智能体AI三大技术领域,强调数据基础的重要性,并提出CIO应从项目思维转向产品思维,通过跨职能团队实现端到端价值交付。
斯坦福大学等机构联合开发的CIFT系统首次解决了机器人"近视眼"问题,通过精确控制真实数据和合成数据的混合比例,让机器人在陌生环境中的表现提升54%以上。该系统包含多视角视频增强引擎MVAug和数据组合优化策略,能够预测数据失效的"去相干点",确保机器人学习真正重要的任务特征而非环境表象,为实用化通用机器人奠定了重要基础。
尽管苹果在AI竞赛中看似落后,但其私有云计算基础设施展现了技术优势。当行业为追赶大语言模型而降低隐私标准时,苹果坚持原则,开发出保护用户数据隐私的技术方案。谷歌最新宣布的类似实施方案验证了苹果技术路线的正确性,这可能推动其他AI实验室采用相同做法,为用户隐私带来重大胜利。
香港中文大学研究团队开发的Search-R3系统成功解决了大语言模型推理与搜索分离的问题,通过两阶段训练让AI在深度思考过程中直接生成搜索向量。该系统在多个领域测试中显著超越现有方法,特别是启用推理后性能提升明显,为AI系统设计提供了推理与搜索统一的新范式,展现了从专门化向通用化发展的重要方向。