据报道,人工智能开发商World Labs Inc.正在与投资者商谈融资,融资金额高达5亿美元。
彭博社周四晚间援引消息人士称,这家由人工智能先驱李飞飞领导的初创公司在此轮融资中的估值可能达到50亿美元。这比2024年的估值高出40亿美元。消息人士补充说,融资条款仍可能发生变化。
该报道未透露预计参与此次交易的投资者姓名,但初创公司融资轮通常都会有现有投资者的参与。World Labs迄今已从英伟达公司的NVentures、AMD Ventures、Adobe Ventures、Databricks Ventures和其他知名投资方筹集了2.3亿美元。这些投资者中至少有几家可能会参与新一轮融资。
World Labs创始首席执行官李飞飞是斯坦福大学的计算机科学教授。她被誉为"人工智能教母",领导开发了ImageNet,这是一个早期的人工智能训练数据集,在现代神经网络的出现中发挥了重要作用。ImageNet被用于开发AlexNet等突破性人工智能模型,该模型帮助引发了人们对这项技术的当前兴趣。
World Labs专注于训练世界模型,这是一种生成三维虚拟环境的神经网络。该公司在11月推出了首个算法Marble。它可以基于用户提供的文本、图像和视频生成虚拟环境。
Marble的旗舰功能之一是名为Chisel的定制工具。它使用户能够从简单的几何结构(如盒子)组装3D对象。然后,他们可以创建具有不同设计风格的对象的多个版本。
Chisel具有应用潜力的市场之一是建筑行业。建筑公司可以创建建筑结构的虚拟副本,然后模拟不同的室内设计选项。
据World Labs称,Marble还适用于多种其他用例。机器人公司可以使用该模型创建仿真环境,在其中测试机器的自主导航软件。视频游戏工作室则可以加速图形设计任务。
历史上,3D图形主要使用称为多边形网格处理的方法进行渲染。该技术从众多微小的三角形组装3D对象。Marble支持称为3DGS的更新渲染方法,可提供更高的视觉保真度。3DGS不使用三角形,而是从数百万个半透明点组装3D对象。
Marble还可以以称为碰撞器网格的低分辨率、硬件高效格式实现3D对象。该格式适用于不需要最大化虚拟环境视觉保真度的仿真用例。
World Labs于周三通过应用程序编程接口提供Marble。在宣布发布时,该公司透露已有多个组织采用了该API。这种早期用户基础的势头可能是投资者预计给World Labs带来40亿美元估值提升的原因之一。
彭博社的消息人士未具体说明该公司计划如何使用这笔资金。一份招聘启事表明,它正在开发基于扩散设计的新世界模型,这是图形生成器的首选架构。World Labs的优先事项之一是创建蒸馏或缩减算法,与前沿模型相比,这些算法需要更少的硬件来运行。
Q&A
Q1:World Labs是做什么的公司?
A:World Labs是由人工智能先驱李飞飞创立的人工智能开发商,专注于训练世界模型,这是一种生成三维虚拟环境的神经网络。该公司推出的Marble算法可以基于用户提供的文本、图像和视频生成虚拟环境。
Q2:Marble算法有哪些主要功能和应用场景?
A:Marble的旗舰功能是名为Chisel的定制工具,用户可以从简单几何结构组装3D对象并创建不同设计风格的版本。应用场景包括建筑行业的室内设计模拟、机器人公司的自主导航软件测试,以及视频游戏工作室的图形设计任务加速。
Q3:World Labs这轮融资的估值和金额是多少?
A:据报道,World Labs正在商谈高达5亿美元的融资,估值可能达到50亿美元,比2024年的估值高出40亿美元。该公司此前已从英伟达NVentures、AMD Ventures、Adobe Ventures等知名投资方筹集了2.3亿美元。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。