2025年,被视为人形机器人量产元年。
据IDC统计数据显示,2024年中国人形机器人商用销售出货量约为2000台,预计到2030年将会达到6万台。
更为振奋的是,过去几个月里,曾经对销量提及甚少的国内人形机器人团队,纷纷对外公布了今年拿到的采购大单,不少团队拿到了百台、千台规模的批量订单,甚至有企业对外公布了万台人形机器人采购订单。
然而,在人形机器人批量进入商业市场的同时,人形机器人目前所具备的能力,仍以执行抓取、放置、分拣等基础任务为主,在算力、算法、数据,乃至整机研发上,如何推动人形机器人持续成长、成长为未来新一代生产力,就成了一个值得整个产业深入思考的关键问题。
为此,我们从人形机器人整机、模型、数据、核心零部件等领域,特别邀请了五位关键企业、机构的技术大佬,将在2025年9月13日(本周六)于北京举行的PEC 2025 暨第二届AI创新者大会上,由至顶科技&科技行者主编金旺主持的具身智能年度提问中,一起聊一聊《新物种时代:人形机器人如何“长大”?》。
这五位重磅嘉宾分别是:
国地共建具身智能机器人创新中心学术委员会主任 张强
香港科技大学博士,研究内容包括人形机器人运动控制、多模态感知、具身智能体和具身多模态大模型,致力于打造通用人形机器人和通用智能体。曾在Fourier GR-1、PNDbotics Adam和国内首个通用机器人母平台天工等多个人形机器人中担任强化学习算法核心研发人员,创新性地将运动先验、高斯溅射等前沿算法思想与人形机器人相结合,取得世界范围内先进的人形机器人运动控制和智能化效果。
张强博士发表机器人及人工智能顶会顶刊论文数十篇,长期担任ICCV、CVPR、ICLR、ICRA、IROS、NeurIPS、RAL和TRO等顶会顶刊审稿人。
数字华夏联合创始人、软件与应用中心总经理 陈军民
西安交通大学硕士,人工智能中级职称,20多年AI算力与机器人研发技术管理,主导IT软硬件产品获深圳市级“创新产品”、“创新人才”等,拥有专利10多项,现任数字华夏联合创始人、软件与服务中心总经理。
地瓜机器人技术副总裁 隋伟
中科院自动化博士,2019年加入地平线,主要负责机器人和自动驾驶场景下,基于旭日和征程系列芯片的2.5D及3D视觉算法研发,曾带领团队成功开发了地平线高阶自动驾驶BEV感知方案,并且搭建了国内首套最为完备且先进的4D Label标注系统。目前旭日系列芯片出货量已达数百万片,BEV感知方案也已在多个车型上定点量产,为自动驾驶领域的发展做出了重要贡献。
隋伟博士在ICRA、IROS、CVPR、TIP、TVCG等国内外知名期刊和会议上先后发表学术论文20余篇,拥有专利40多项。此外,他长期担任ICRA、IROS等机器人会议的审稿人,同时担任《智能驾驶和机器视觉》《智能驾驶与多维重建》等自动驾驶相关著作的主编。
跨维智能具身智能算法总监 郭成凯
前小米深度学习组研究员,人工智能算法专家,曾负责百度网盘架构和研发、担任小米深度学习组算法专家,主要研究下一代通用人工智能(AGI)系统。主导了700亿参数文献大模型的研发,目前关注在人形机器人具身大模型方向研发。
幂特科技联合创始人兼CTO 王志成
清华大学计算机系硕士,三届COCO人体姿态识别比赛冠军,拥有10年AI 研究和落地经验,现担任幂特科技CTO。
PowerTech致力于打破具身智能数据采集的瓶颈,通过低成本的方式获取高质海量的机器人训练数据,助力具身智能加速到达“ChatGPT”时刻。公司自研的“视觉动捕”核心技术通过“视频仿真”和“视觉遥操”的两种不同的产品形态被应用于具身智能机器人的训练场景,为具身智能数据生产提供了集“仿真”和“真机”于一体的端到端完整数据解决方案。
以下为本届大会具体议程:
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。