2025年,被视为人形机器人量产元年。
据IDC统计数据显示,2024年中国人形机器人商用销售出货量约为2000台,预计到2030年将会达到6万台。
更为振奋的是,过去几个月里,曾经对销量提及甚少的国内人形机器人团队,纷纷对外公布了今年拿到的采购大单,不少团队拿到了百台、千台规模的批量订单,甚至有企业对外公布了万台人形机器人采购订单。
然而,在人形机器人批量进入商业市场的同时,人形机器人目前所具备的能力,仍以执行抓取、放置、分拣等基础任务为主,在算力、算法、数据,乃至整机研发上,如何推动人形机器人持续成长、成长为未来新一代生产力,就成了一个值得整个产业深入思考的关键问题。
为此,我们从人形机器人整机、模型、数据、核心零部件等领域,特别邀请了五位关键企业、机构的技术大佬,将在2025年9月13日(本周六)于北京举行的PEC 2025 暨第二届AI创新者大会上,由至顶科技&科技行者主编金旺主持的具身智能年度提问中,一起聊一聊《新物种时代:人形机器人如何“长大”?》。
这五位重磅嘉宾分别是:
国地共建具身智能机器人创新中心学术委员会主任 张强
香港科技大学博士,研究内容包括人形机器人运动控制、多模态感知、具身智能体和具身多模态大模型,致力于打造通用人形机器人和通用智能体。曾在Fourier GR-1、PNDbotics Adam和国内首个通用机器人母平台天工等多个人形机器人中担任强化学习算法核心研发人员,创新性地将运动先验、高斯溅射等前沿算法思想与人形机器人相结合,取得世界范围内先进的人形机器人运动控制和智能化效果。
张强博士发表机器人及人工智能顶会顶刊论文数十篇,长期担任ICCV、CVPR、ICLR、ICRA、IROS、NeurIPS、RAL和TRO等顶会顶刊审稿人。
数字华夏联合创始人、软件与应用中心总经理 陈军民
西安交通大学硕士,人工智能中级职称,20多年AI算力与机器人研发技术管理,主导IT软硬件产品获深圳市级“创新产品”、“创新人才”等,拥有专利10多项,现任数字华夏联合创始人、软件与服务中心总经理。
地瓜机器人技术副总裁 隋伟
中科院自动化博士,2019年加入地平线,主要负责机器人和自动驾驶场景下,基于旭日和征程系列芯片的2.5D及3D视觉算法研发,曾带领团队成功开发了地平线高阶自动驾驶BEV感知方案,并且搭建了国内首套最为完备且先进的4D Label标注系统。目前旭日系列芯片出货量已达数百万片,BEV感知方案也已在多个车型上定点量产,为自动驾驶领域的发展做出了重要贡献。
隋伟博士在ICRA、IROS、CVPR、TIP、TVCG等国内外知名期刊和会议上先后发表学术论文20余篇,拥有专利40多项。此外,他长期担任ICRA、IROS等机器人会议的审稿人,同时担任《智能驾驶和机器视觉》《智能驾驶与多维重建》等自动驾驶相关著作的主编。
跨维智能具身智能算法总监 郭成凯
前小米深度学习组研究员,人工智能算法专家,曾负责百度网盘架构和研发、担任小米深度学习组算法专家,主要研究下一代通用人工智能(AGI)系统。主导了700亿参数文献大模型的研发,目前关注在人形机器人具身大模型方向研发。
幂特科技联合创始人兼CTO 王志成
清华大学计算机系硕士,三届COCO人体姿态识别比赛冠军,拥有10年AI 研究和落地经验,现担任幂特科技CTO。
PowerTech致力于打破具身智能数据采集的瓶颈,通过低成本的方式获取高质海量的机器人训练数据,助力具身智能加速到达“ChatGPT”时刻。公司自研的“视觉动捕”核心技术通过“视频仿真”和“视觉遥操”的两种不同的产品形态被应用于具身智能机器人的训练场景,为具身智能数据生产提供了集“仿真”和“真机”于一体的端到端完整数据解决方案。
以下为本届大会具体议程:

好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。