计算机视觉初创公司Matrice.ai Inc.今日宣布完成种子轮融资的战略扩张,这是对其5月份首次披露的原始投资的补充。
公司未透露具体融资规模,但云基础设施提供商Voltage Park Inc.被确认为领投方,Ax3.ai、Plug and Play Ventures以及多位天使投资人参与了本轮融资。
该公司开发了一个备受欢迎且快速增长的无代码平台,用于创建能够感知其运行环境的人工智能模型。该平台旨在简化计算机视觉模型的开发过程,其无代码方法使模型的构建和部署速度比传统方法快40%。该初创公司还表示,由于消除了编码的繁重工作,可以将开发成本降低多达80%。
Matrice.ai无代码方法的主要优势之一是任何人都可以使用其平台,无论其编程背景如何。它提供了一个用户界面,允许用户概述他们对计算机视觉模型的想法,然后自动创建相关代码并开始训练。
该初创公司还强调其以数据为中心的计算机视觉模型设计方法,并提供工具来自动化数据集标记过程,使其能够用于训练特定应用的视觉模型。这一点很重要,因为提供的数据越多,创建的模型质量就越好。一旦模型训练达到用户满意度,Matrice.ai将在用户选择的云端、本地或边缘环境中部署它。
计算机视觉是自动化的强大工具,赋予机器解释和理解视觉数据的能力。通过快速实时处理大量视觉信息,它可以提高从工厂机器到传感器和无人机等各种设备的准确性和效率。
例如,在制造业中,计算机视觉使得高速检查成品或组件成为可能,自动识别任何可能难以看到或人眼无法察觉的缺陷。在医疗保健等领域也极其有用,它可以比医生更快地分析医学扫描并协助诊断。在零售业,它可以让购物者在店内虚拟试穿新牛仔裤或连衣裙。在汽车领域,它可以帮助自动驾驶车辆通过快速扫描周围环境来避开障碍物。
Matrice.ai表示其Vision Factory平台已经获得了大量粉丝,并声称正在为远至菲律宾和中东地区的企业"数百台实时摄像头"提供支持。许多客户来自能源和零售行业,还有一些来自公共部门。该公司补充说,其模型支持油田、零售楼层、智慧城市、体育场馆等应用。
Matrice.ai联合创始人兼首席执行官Amar Krishna表示,Voltage Park的支持不仅为公司提供了资本,还为在工业和商业环境中部署强大的计算机视觉模型提供了关键基础设施。
Voltage Park不是普通的投资者。其主要业务是AI行业,已开发了一个包含超过24,000个图形处理单元、跨越六个数据中心的云基础设施平台。它提供低成本、按需和裸机访问GPU,无需虚拟化层,从而提高性能和可预测性。
除了云业务外,它还支持精选的AI初创公司,为它们提供以最具竞争力价格访问其云资源的机会。
"它不仅仅是财务支持者——它是我们共同开发和部署视觉AI工厂的合作伙伴,"Krishna说道,并提到了其用于AI训练和推理的企业级基础设施。"现在,我们可以以前所未有的速度和成本构建和部署高度准确的定制视觉模型。"
Voltage Park首席产品和技术官Saurabh Giri表示,他的公司新兴投资部门寻找那些从理论阶段转向变革阶段的初创公司,并认为Matrice.ai是这类公司的绝佳典范。
"其在视觉模型方面的领域专业知识使我们的客户能够通过跨多个行业的垂直特定解决方案将像素转换为智能,"他说道。
Krishna补充说,他渴望扩展到公司目前深耕的亚洲和中东市场之外,在美国和欧洲建立存在感。同时,该公司还瞄准计算机视觉模型的新应用,如火焰检测、人群分析和队列监控系统。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。