由全球顶尖大学研究人员合作建立的人工智能实验室 Oumi PBC,今天宣布推出其所描述的全球首个"无条件开放的 AI 平台"。
该计划旨在通过提供开放访问基础模型、数据集和开发工具,打造一个协作式的 AI 研究和开发生态系统。
Oumi 表示,迄今为止,基础 AI 模型的开发主要由限制模型访问的大型科技公司主导。即使被标记为"开源"的模型往往也缺乏完全的透明度,它们提供开放权重(即训练模型的数值参数),但不提供用于训练它们的代码或数据。Oumi 表示,它试图通过提供一个确保 AI 模型和研究完全可访问、可复制且可由任何人修改的平台来改变这种现状。
"AI 需要它的 Linux 时刻,"Oumi 的联合创始人兼首席执行官 Manos Koukoumidis (如图右) 说道,他此前曾领导 Google Cloud 的 AI 计划。"要让开源取得成功,你必须提供每个人需要的工具。"
盈利与使命并重 Oumi 作为一家公益企业运营,这意味着它是一家营利性公司,但在法律上有义务在财务目标与既定的社会或环境使命之间保持平衡。该公司已获得由 Venrock Management LLC 和风险投资公司 Obvious Management Services LLC 领投的 1000 万美元种子轮融资,Plug and Play Platform Spain SL 和 Ascend Venture Capital GP LLC 也参与其中。
Oumi 平台具有可扩展性,允许研究人员使用自己的工具和工作流程,确保与各种 AI 开发方法的兼容性。它还优先考虑可复现性,这是科学研究中的关键因素。Koukoumidis 说:"我们希望确保生产和推进研究的完整流程是完全可记录和可复现的。"
Oumi 最初以 Apache 2.0 许可证下的开源存储库形式启动。开发者可将其用于研究和商业用途。虽然 Oumi 目前不提供平台的托管版本,但公司对未来推出托管服务持开放态度。
灵活且可扩展 Oumi 平台设计为在单一统一系统中支持所有主要基础模型工作流程。主要功能包括能够使用监督式微调、低秩适应、量化低秩适应和直接性能优化等高级技术来训练和微调从 1000 万到 4050 亿参数不等的模型。它可以处理文本和多模态模型,包括 Llama、Qwen 和 Phi。
该工具包支持使用大语言模型评判器合成和整理训练数据,并能够通过流行的推理引擎(如 vLLM 和 SGLang)部署模型。开发者可以根据既定的 AI 基准评估模型,并在从个人笔记本电脑到超大规模云平台的各种环境中工作。该平台与开放模型以及 OpenAI LLC、Anthropic PBC 和 Vertex Systems Oy 等商业模型开发者提供的应用程序接口集成。
Oumi 的创始人认为,目前的 AI 研究格局通过将开发限制在企业孤岛中而造成了人为的创新障碍。"我们的愿景是让 AI 成为终极团队运动,"Oumi 的联合创始人、前 Apple Inc. 机器学习工程师 Oussama Elachqar (如图左) 说。"为 AI 人才提供一个可以集体工作的平台将加速进步,并加快 AI 各个领域的发现。"
超越开放权重 该公司的首次亮相早在中国初创公司 DeepSeek 本周以远低于其他替代方案的成本开发出一个功能强大的大语言模型之前就已计划好了。
Koukoumidis 指出,DeepSeek 以开放权重许可发布其模型,提供了 AI 模型的训练参数,但不包括完整的源代码、训练数据或方法论。
"Oumi 的目标是使社区能够构建下一个真正开放的 DeepSeek,然后是后续版本,"他在书面评论中说。"DeepSeek 的成就表明,解决 AI 开发挑战并不像受计算能力限制那样,而是更多地受人才限制,当前的 AI 格局造成了一种虚假的稀缺感。"他说,一个完全开放的平台可以利用规模经济来提高效率。
来自伊利诺伊大学香槟分校、卡内基梅隆大学、普林斯顿大学、加州理工学院、加州大学伯克利分校、华盛顿大学、纽约大学、麻省理工学院、滑铁卢大学、剑桥大学和牛津大学的 AI 研究人员正在开发该平台。Oumi 表示计划促进完全开放参与的协调研究工作。
Oumi 邀请有兴趣贡献或使用该平台的研究人员访问公司网站或 GitHub 页面了解更多信息。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。