2025年,被视为人形机器人量产元年。
据IDC统计数据显示,2024年中国人形机器人商用销售出货量约为2000台,预计到2030年将会达到6万台。
更为振奋的是,过去几个月里,曾经对销量提及甚少的国内人形机器人团队,纷纷对外公布了今年拿到的采购大单,不少团队拿到了百台、千台规模的批量订单,甚至有企业对外公布了万台人形机器人采购订单。
然而,在人形机器人批量进入商业市场的同时,人形机器人目前所具备的能力,仍以执行抓取、放置、分拣等基础任务为主,在算力、算法、数据,乃至整机研发上,如何推动人形机器人持续成长、成长为未来新一代生产力,就成了一个值得整个产业深入思考的关键问题。
为此,我们从人形机器人整机、模型、数据、核心零部件等领域,特别邀请了五位关键企业、机构的技术大佬,将在2025年9月13日(本周六)于北京举行的PEC 2025 暨第二届AI创新者大会上,由至顶科技&科技行者主编金旺主持的具身智能年度提问中,一起聊一聊《新物种时代:人形机器人如何“长大”?》。
这五位重磅嘉宾分别是:
国地共建具身智能机器人创新中心学术委员会主任 张强
香港科技大学博士,研究内容包括人形机器人运动控制、多模态感知、具身智能体和具身多模态大模型,致力于打造通用人形机器人和通用智能体。曾在Fourier GR-1、PNDbotics Adam和国内首个通用机器人母平台天工等多个人形机器人中担任强化学习算法核心研发人员,创新性地将运动先验、高斯溅射等前沿算法思想与人形机器人相结合,取得世界范围内先进的人形机器人运动控制和智能化效果。
张强博士发表机器人及人工智能顶会顶刊论文数十篇,长期担任ICCV、CVPR、ICLR、ICRA、IROS、NeurIPS、RAL和TRO等顶会顶刊审稿人。
数字华夏联合创始人、软件与应用中心总经理 陈军民
西安交通大学硕士,人工智能中级职称,20多年AI算力与机器人研发技术管理,主导IT软硬件产品获深圳市级“创新产品”、“创新人才”等,拥有专利10多项,现任数字华夏联合创始人、软件与服务中心总经理。
地瓜机器人技术副总裁 隋伟
中科院自动化博士,2019年加入地平线,主要负责机器人和自动驾驶场景下,基于旭日和征程系列芯片的2.5D及3D视觉算法研发,曾带领团队成功开发了地平线高阶自动驾驶BEV感知方案,并且搭建了国内首套最为完备且先进的4D Label标注系统。目前旭日系列芯片出货量已达数百万片,BEV感知方案也已在多个车型上定点量产,为自动驾驶领域的发展做出了重要贡献。
隋伟博士在ICRA、IROS、CVPR、TIP、TVCG等国内外知名期刊和会议上先后发表学术论文20余篇,拥有专利40多项。此外,他长期担任ICRA、IROS等机器人会议的审稿人,同时担任《智能驾驶和机器视觉》《智能驾驶与多维重建》等自动驾驶相关著作的主编。
跨维智能具身智能算法总监 郭成凯
前小米深度学习组研究员,人工智能算法专家,曾负责百度网盘架构和研发、担任小米深度学习组算法专家,主要研究下一代通用人工智能(AGI)系统。主导了700亿参数文献大模型的研发,目前关注在人形机器人具身大模型方向研发。
幂特科技联合创始人兼CTO 王志成
清华大学计算机系硕士,三届COCO人体姿态识别比赛冠军,拥有10年AI 研究和落地经验,现担任幂特科技CTO。
PowerTech致力于打破具身智能数据采集的瓶颈,通过低成本的方式获取高质海量的机器人训练数据,助力具身智能加速到达“ChatGPT”时刻。公司自研的“视觉动捕”核心技术通过“视频仿真”和“视觉遥操”的两种不同的产品形态被应用于具身智能机器人的训练场景,为具身智能数据生产提供了集“仿真”和“真机”于一体的端到端完整数据解决方案。
以下为本届大会具体议程:

好文章,需要你的鼓励
Converge Bio完成550万美元种子轮融资,由TLV Partners领投。该公司专为生物科技和制药行业打造LLM应用平台,提供数据增强、模型微调及可解释性分析等功能,帮助企业将通用生物基础模型转化为可实际落地的研发工具。以抗体研究为例,平台可将抗体LLM精调至氨基酸级别的结合亲和力预测,并生成优化序列。公司计划用于扩充团队、拓展客户,并发布抗体设计科研论文。
香港大学与哈尔滨工业大学联合发布的这项研究(arXiv:2605.06196)发现,大语言模型在扮演不同社会层级角色时,内部神经网络存在一条清晰的"粒度轴",从普通个人视角延伸至全球机构视角。这条轴是AI角色空间的主导几何方向,可被测量、被跨模型复现,并通过激活引导技术加以操控,为AI社会模拟的可信度评估和角色视角的主动调控提供了新工具。
ChatGPT高级语音模式的创造者Alexis Conneau离开OpenAI后,创办了音频AI初创公司WaveForms AI,并获得由a16z领投的4000万美元种子轮融资。该公司专注于训练自有音频大语言模型,计划于2025年推出与OpenAI、谷歌竞争的AI音频产品。Conneau深受电影《Her》启发,致力于开发具备情感感知能力的语音AI,同时警惕AI伴侣化带来的社会问题,强调技术应服务于人而非取代人际关系。
华盛顿大学研究团队发现,在AI数学推理训练中,将随机拼凑的拉丁文占位词(Lorem Ipsum)添加到题目前,能帮助AI突破"全部答错、训练停滞"的困境,在多个模型上平均提升推理得分2.8至6.2分。研究揭示了有效扰动的两个关键特征:使用拉丁语词汇避免语义干扰,以及保持较低困惑度确保AI能正确理解题目内容。