英特尔公司的计算机视觉子公司RealSense今日宣布,在完成5000万美元融资后,已作为独立公司从母公司分拆运营。
本轮融资由一家未透露名称的半导体私募股权公司领投,英特尔资本和联发科创新基金等战略投资者参与投资。该公司表示,这笔资金将使RealSense能够拓展相邻市场,并推进人工智能、机器人技术和生物识别领域的创新。
RealSense专门开发深度感知和跟踪计算机视觉系统,使配备摄像头的机器人、无人机和其他设备能够感知和理解其运行的三维环境。
该公司的主打产品是广受欢迎的"深度摄像头"系列,采用立体视觉、结构光和飞行时间技术来确定深度。这些摄像头经常应用于机器人中,帮助它们精确测量与特定物体的距离。机器人和无人机利用这项技术创建环境的三维地图,从而实现导航和避障,确保安全运行。
此外,RealSense还开发用于创建物体和环境三维模型的3D扫描技术,以及用于无接触设备和安全应用的手势和面部识别技术。
RealSense首席执行官纳达夫·奥尔巴赫表示,随着AI驱动的人形机器人、自主移动机器人以及AI驱动的门禁控制和安全系统的兴起,公司面临着巨大的发展机遇。他在谈到与英特尔的分离时说:"我们的独立性使我们能够更快地行动,更大胆地创新,以适应快速变化的市场动态,在AI创新和即将到来的机器人复兴中引领潮流。"
这家初创公司在独立发展的道路上势头强劲,其深度摄像头据称已嵌入全球约60%的自主移动机器人和人形机器人中,包括Mobile Industrial Robots A/S、Fit:match.ai Inc.和ANYbotics AG等公司的产品。该公司在全球拥有超过3000名客户,并持有80多项与计算机和嵌入式视觉系统相关的专利。
此外,该公司认为自己正站在一个巨大机遇的边缘,预测显示机器人市场价值将在未来六年内从目前的500亿美元增长四倍至超过2000亿美元。预计这一增长很大程度上将由依赖计算机视觉感知的人形机器人和其他机器人推动。此外,RealSense表示,随着生物识别技术在机场安检和活动入场系统中成为主流,生物识别行业也将迎来快速增长。
奥尔巴赫表示,该公司的视觉技术是促进AI和机器人技术融合的秘密武器,为它们在日常生活和工作环境中的安全应用铺平道路。
奥尔巴赫承诺:"这项技术不是为了取代人类的创造力或决策能力,而是为了消除人类工作中的危险和繁重任务。我们的系统旨在通过将这些任务转移给配备智能、安全和可靠视觉系统的机器来增强人类潜能。"
为了应对即将到来的视觉和深度摄像头需求浪潮,RealSense将利用本轮融资资金扩大市场团队,并通过招聘更多AI、机器人技术和软件工程师来加速产品开发。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。