AI 赋能机器人及 Optimus 进展成为双主线。
人形机器人产业趋势的共 识在多轮行情中逐渐形成,呈现 AI 技术发展+产业巨头加持+政策支持的 三重共振,AI 赋能机器人及特斯拉 Optimus 进展也成为板块的双主线。 多模态视觉语言模型与机器人的结合超大众预期。2023 年 12 月特斯拉发 布 Optimus Gen-2 的视频,相比于第一代 Optimus 人形机器人,第二代 Optimus 增加六维力传感器、触觉传感器,进步明显,速度快 30%、重量 减轻 10kg。
机器人加速国内传感器行业发展,国内传感器厂商为机器人蓄力。
机器人 了解周围环境需要广泛的信息,传感器是重要的“中介”,是机器人软硬 件结合关键步骤之一,人形机器人需要的传感器种类众多,包括但不限于 触觉/力/扭矩/视觉/惯性等传感器,传感器技术涉及物理、电子、材料学 等多种学科融合,存在极高的技术壁垒,因此过去在传感器市场中占据一 席之地的更多是国外厂商。行至今日,国内众多优秀的传感器公司如雨后 春笋般出现,如发布多维触觉传感器的帕西尼、具备全方位 3D 视觉产业 链技术的奥比中光、具备玻璃微熔拉压力传感器技术的安培龙等,国内传 感器厂商有望在人形机器人浪潮中充分受益。
机器人行业已呈现 AI 发展&产业巨头&政策支撑三重共振特性,在产业起点积蓄 力量。多模态大语言模型的出现,代表人形机器人“大脑”层面难题取得突破。同时 2022 年以来产业巨头陆续入局,中、美等国政策支持也相继推出,在三重共振下,人形机器 人有望形成类似于汽车、智能手机的全球性产业链。
第一:AI 技术发展。通用人工智能大模型是实现“具身智能”的关键一环,近年人工智 能快速发展,机器人装上“大脑”成为可能。机器人的大脑需要解决解理、决策、执行 三个层面的问题,以 ChatGPT3.5 为代表多模态大语言模型解决了机器人理解人类语言 和外部世界的问题;谷歌 RT-1 模型以图片序列、自然语言指令作为输入,是一种视觉- 语言模型(VLMs),展现了较强的泛化能力和鲁棒性,主要解决了前两个层面的问题;而 谷歌 RT-2 模型则是基于视觉-语言-动作模型(VLA)的端到端模型,加入了动作模态, 提高了机器人的泛化能力、涌现能力和策略的完成率。RT-2 已经足够具身化,将机器人 执行层的感知、任务拆解、硬件驱动实现了 AI 化。
第二:产业巨头入局。自特斯拉机器人亮相以来,全球产业巨头纷纷布局人形机器人领 域。特斯拉作为行业引领者,于 2022 年 9 月 30 日举办的 AI DAY 上首次公开展示人形 机器人;2023 年年初,三星向本土机器人厂商 Rainbow Robotics 投资 590 亿韩元,约 合人民币 3.19 亿元;2023 年 3 月,OpenAI 领投挪威机器人公司 1X Technologies;2023 年 5 月,NVIDIA 创始人黄仁勋表示下一波人工智能浪潮是具身智能(embodied AI); 谷歌在推出有 5620 亿参数的 PalM-E 模型后,其旗下 AI 团队 DeepMind 在 2023 年 6 月 20 日展示了用于机器人的 AI 智能体 RoboCat,并于 7 月发布机器人大模型 RT-2;2024 年 3 月,黄仁勋在机器人大会上公布其 GR00T 项目,推出人形机器人通用基础模型 Project GR00T 和一款基于 NVIDIA Thor 系统级芯片(SoC)的新型人形机器人计算平台 Jetson Thor。
第三:政策支持,中美共振。2022 年以来国内人形机器人相关政策频出,北京、上海、 深圳等地都出台了推动产业发展的地方性政策。2023 年 10 月,工信部印发《人形机器 人创新发展指导意见》,将人形机器人提升到与计算机、智能手机、新能源汽车同等的战 略高度,并表示人形机器人有望在 2027 年成为经济增长的新引擎。美国方面,2024 年 3 月,美联储半年度货币政策提出,未来几年美国可能快速采用人工智能和机器人等新 技术,有望提高生产力增长速度。
好文章,需要你的鼓励
知名的投资机构ICONIQ Capital发布了《开发者手册:2025年AI现状报告》,基于对300位企业高管的调研,包括CEO、工程负责人、AI负责人和产品负责人等关键决策者,涵盖了从初创公司到十亿美元巨头的各个发展阶段,深度剖析了当下企业AI产品应用的全貌,为我们呈现了一个从"如何构思、交付和规模化AI驱动业务"的完整路线。
中科大团队开发出LongAnimation系统,解决了长动画自动上色中的色彩一致性难题。该系统采用动态全局-局部记忆机制,能够为平均500帧的动画进行稳定上色,性能比现有方法提升35-58%。核心创新包括SketchDiT特征提取器、智能记忆模块和色彩优化机制,可大幅提升动画制作效率。
南开大学团队开发出DepthAnything-AC模型,解决了现有AI距离估算系统在恶劣天气和复杂光照条件下性能下降的问题。通过创新的扰动一致性训练框架和空间距离约束机制,该模型仅用54万张图片就实现了在雨雪、雾霾、夜晚等复杂环境下的稳定距离判断,同时保持正常条件下的优秀性能,为自动驾驶和机器人导航等应用提供了重要技术支撑。