栏目| 机器人新纪元
2018年,在国内互联网公司快速对外扩张版图进程中,一个名为朝夕日历的产品出现在了某互联网大厂的版图中,这是一款智能日程管理工具型APP,早年间曾因“早起打卡”功能火爆一时。
不过,“早起打卡”并不是这款产品最初的设想。
程昊和他的团队是这款产品的创造者,他毕业于清华大学自动化系,是典型的机器人科班出身。
程昊告诉科技行者:
“我从小就喜欢机器人,高考时,清华大学去我们学校招生,我问来招生的老师,清华大学哪个系是做机器人的,他们告诉我,自动化系是做机器人的,于是我报考了清华大学自动化系。
等到了清华大学,我又问,哪个实验室是做机器人的,后来知道了赵明国教授的机器人实验室,我就在本科加入了实验室做机器人踢足球。”
至于后来创业做的朝夕日历,其实也藏着程昊对于机器人的“徐徐图之”。
程昊说,”当时朝夕日历的产品定义其实是智能时间助理,它虽然不是机器人,但会是未来机器人大脑的一部分。“
实际上,在创业做朝夕日历时,程昊做过一个“三步走”的商业计划——先做日程助理,再做通用智能助理,最后做机器人大脑。
虽然朝夕日历最终没有按照程昊最初的规划发展下来,不过,在2022年,当马斯克发布特斯拉人形机器人、在OpenAI的ChatGPT面世后,程昊下定决心重回机器人赛道,做自己的人形机器人。
于是,2023年,一支清华系人形机器人团队——加速进化开始闯入江湖。
我们见到程昊时,他刚从RoboCup 2024回来不久,和十年前作为参赛者奔赴赛场不同的是,这次,他是作为清华大学火神队赞助参加的这次大赛。
清华大学火神队,作为中国最顶尖的机器人“足球队”,在被视为机器人“世界杯”的RoboCup大赛中,多次位列三甲,程昊作为曾经的清华大学火神队队长,也曾带队参加过RoboCup。
彼时,人形机器人的关节还依赖于基于位控的小型舵机,负载能力有限,再加上主控系统算力不足,跑不了复杂算法,面对复杂环境和不同路面时,人形机器人的运动能力就显得有些捉襟见肘。
更重要的是,当时的视觉算法都还是基于OpenCV框架,令程昊印象深刻的是,为了能够让人形机器人踢足球,他们当时需要写很多代码,而如果要将人形机器人应用到其他场景,则又需要从头开始写大量代码。
程昊当时就在想,如果这样的人形机器人要应用到工业,乃至家庭场景中,需要编写的代码量一定是极为庞大的,这样的人形机器人显然不具备落地的可能性。
这也是机器人科班出身的程昊,虽然有着做人形机器人的梦想,但在毕业后依然选择了远赴美国,在亚马逊从人工智能研发工程师做起的原因。
这之后的十年里,程昊又辗转创业朝夕日历、进入互联网大厂,一直在人工智能领域摸爬滚打。
从关注技术本身到关注产品体验、关注产品商业化,再到大型团队管理,冥冥之中,程昊的这些经历似乎都在为另一次创业做准备,一次真正从人工智能技术跨越到人形机器人这一他梦寐以求的领域。
十年之后,当马斯克发布人形机器人、OpenAI发布ChatGPT后,人形机器人热潮终于来临时,程昊找到赵明国教授,他想从这位曾经的授业恩师这里找到一个答案,一个他思考了很久的问题的答案:
这波机会是不是必须入局?如果现在不入局是不是就晚了?
最后师生二人讨论的结果是,这波热潮一定不会让人形机器人“起飞”,但现在不入局的话,很可能就没机会了。
为什么现在不入局就没机会了?
程昊以新能源汽车为例,向科技行者进行了分析:
“蔚小理”都是2014-2015年组建的团队,但新能源汽车真正迎来市场爆发却是在2020年,在这之前,国内新能源汽车市场很长一段时间都属小众市场,鲜有人问津。
但是如果不是从2015年就开始入局,除非华为小米这样体量的公司,创业团队要想在2020年进入新能源市场,已经不再有机会。
“创业团队一定要抢跑,这是创业团队唯一的机会。”
那么,为什么又说这波热潮不会让人形机器人“起飞”?
这源于他们对于人形机器人相关技术的另一个判断。
02 程昊的TPMF方法论
今年的RoboCup 2024在荷兰埃因霍温举办,程昊再次来到现场。
令程昊印象最深的是,之前“成人组”人形机器人足球赛中,各参赛组的人形机器人在比赛过程中总是摔倒,很难说有什么观赏性,但这次他看到,参赛的几支强队的人形机器人整体水平得到了极大的提升——移动速度已经很快,射门球速也很快,队伍之间都有互相进球,比赛的观赏性由此也得到了大幅提升。
人形机器人足球赛观赏性的提升,正是得益于这些年人形机器人相关技术的全面提升,这也是程昊在2023年决心再次创业做人形机器人的原因。
当再次创业做人形机器人时,程昊对技术、产品、商业化已经有了一套自己的方法论,他将之总结为TPMF,Technology Product Market Fit。
他认为,人形机器人产业一定是一个多轮迭代、螺旋上升的过程,在这个过程中,每一轮迭代都将是技术发展到一定程度,会先形成一个产品,产品再到市场中找到相匹配的市场,然后再进一步推动技术进行迭代。
在程昊看来,现在的人形机器人刚好赶上第一轮迭代机会。
在这次机会中,过去几年四足机器人和协作机械臂的广泛应用,以及大模型、力控关节和基于力控关节算法的初步成熟,尤其是基于强化学习的运动控制算法在四足机器人上的跑通,业界普遍认为,强化学习在人形机器人上跑通已经是一个确定性很强的事。
这时,人形机器人要完成第一轮技术迭代,就只差最后一块拼图——大脑。
通用,是人形机器人与生俱来的特性,但在上一个技术周期中,人形机器人每做一件事,都需要软件工程师编写大量代码,即便是同一类任务,一旦换了一个环境,就有大量的代码需要重写。
由于通用的大脑的缺失,使得当时几乎看不到实现通用人形机器人的希望。
大模型的出现,成了扭转局面的关键。
“当你和大模型聊天时,你会发现,你说什么,他都能和你聊两句,虽然聊得可能还不够好,但让我们看到了实现人形机器人通用性的可能性。”
更重要的是,强化学习算法在机器人上的应用,已经能够将人形机器人单项能力做得很不错。
例如,在WRC 2024上,加速进化现场展示了这样一个DEMO:
在加速进化的人形机器人面前放几个不同颜色的球,工程师告诉机器人将红色的球抛到场内,人形机器人就可以自己识别出红色球,并将球抛出。
程昊告诉我们,“在这套动作背后,以往是通过写大量代码,通过if else语句进行识别的,现在只需要将这个问题抛给大模型,再通过思维链让机器人做选择,机器人就能完成这项任务。”
这样的技术,让构建机器人通用大脑成为可能。
不过,程昊依然认为,即便是这样的技术突破,TPMF第一轮技术迭代中的“T”依然没有完全ready,要将这样的技术在人形机器人上成熟应用,依然有很长的路要走。
03 产品飞轮,开始加速
在和赵明国教授得出“必须入局”这个结论后,程昊迅速行动起来,先是从清华大学的师兄弟中快速拉起一支硬件团队,之后又从互联网大厂中找来了几位软件专家,这就有了现在的加速进化。
加速进化成立于2023年8月,第一个人形机器人项目于当月立项,而团队完成第一款人形机器人的研发,仅仅用了两个月。
在这之后,加速进化的人形机器人几乎在以每两个月迭代一代产品的速度,快速迭代着他们的产品。
尤其在波士顿动力官宣Atlas转向电驱、并以惊人的灵活性从地面站起来后,加速进化二代人形机器人BR002仅用三天就复现了波士顿动力Atlas动作,产品研发速度之快超乎想象。
实际上,加速进化的产品研发速度,也代表了国内这波人形机器人创业团队的产品迭代速度。
之所以大家的人形机器人能够如此快速成型,程昊认为最重要有两方面原因:
第一,基础零部件的成熟。
尤其是机器人开源力量的快速发展,降低了机器人产品研发的门槛,人形机器人构型接下来将会逐渐收敛。
第二,强化学习在运动控制算法上的应用。
强化学习在人形机器人领域应用之前,基于WPC、MPC的运动控制算法需要研发人员亲自去推导公式、计算每个关节具体该如何运动,应用强化学习后,只要设定好奖惩机制,机器人就可以自己在仿真环境中训练出结果。
不过,程昊告诉科技行者,“即便现在大家产品研发速度都很快,要真正做好一款人形机器人产品,依然需要花大量时间来打磨,这其中不只是由单纯技术导向,甚至还有企业战略、商业模式。”
对此,程昊以智能手机的发展为例解释称:
“智能手机发展早期阶段,市面上品牌林立,即便是一个全新的团队,也可以直接套用华强北的方案快速做出一款智能手机,但这些手机无论是在产品稳定性、系统更新上,还是在软件生态、售后服务上,体验往往不佳。
随着市场慢慢成熟,手机品牌越来越少,也才有了现在的手机市场格局。”
程昊和他的团队在做人形机器人产品研发过程中,很多技术和关键部件是一脉相承的,例如BR001和BR002在腿部构型上是完全一样的,只是针对在实际测试场景中出现的问题进行了相应的技术迭代。
在加速进化当下的商业规划中,目标市场依然是科研市场,更具体来说,是做足球机器人。
这既是加速进化团队所擅长的领域,也是程昊的一个判断。
人形机器人在场上踢足球、找足球会涉及到眼睛和腿部的配合,同时也涉及到大脑的准确决策,人形机器人在仓库里做搬运工作,也会涉及到手眼脑的配合,二者其实有着很高的相似度。
实际上,在现阶段研发人形机器人过程中,除了考虑动作完成度外,程昊和他的团队考虑最多的问题是,他们的机器人是否耐摔,如果真摔坏了需要怎样的售后服务去支持。
程昊告诉我们,“通过这一年来的技术迭代,加速进化第三代人形机器人在动作完成度上越来越高,已经可以作为一款产品提供给开发者。”
2024年,当人形机器人继续火爆全球、越来越多团队涌入这一赛道时,商业化也就成了必须考虑的问题。
这时,制造业场景是最多被提及的人形机器人落地场景,也一度被视为人形机器人的标杆场景来广泛传播。
程昊认为,“人形机器人最先得到应用的市场不会是制造业,也不会是家庭。”
这是因为前文提到的,现在人形机器人的技术成熟度还不足以支撑它做如此复杂的工作。
不过,他告诉我们,现在大家在制造业场景做DEMO、做推广有点类似上个世纪70年代PC针对家庭场景做DEMO、拍广告。
当时PC的主流受众还是科研机构、学校机房,是学习编程、认为计算机是未来趋势的人,但进入企业、进入家庭是PC更广泛的应用市场,需要让大家意识到PC的前景。
人形机器人的终极目标一定是进入工厂和家庭,不过,在这之前,足球机器人会是一个中间商业地带,也是相信人形机器人未来的开发者最关注的一个领域,加速进化现阶段瞄准的正是这一市场。
在这次创业之前,程昊研读了自70年代以来的计算机发展历史,他告诉我们,“人形机器人的进化过程将会和计算机的发展有很多相似之处,计算机最先进入科研领域时,没有人会觉得个人乃至家庭需要PC,但互联网时代的到来,成就了PC。”
“类比PC的发展历程,现在的人形机器人依然处于70年代早期的计算机启蒙阶段,我们还没有看到什么会是人形机器人的互联网,但人形机器人的互联网时代终究会到来。”
至于人形机器人何时能够进入家庭,程昊认为,“当人形机器人能够在不伤到人类的情况下,可以和一个普通的人类足球队踢完一场足球赛,还能赢得比赛,那时的人形机器人就可以进入家庭了。”
这个时间,或许是2030年。
好文章,需要你的鼓励
人工智能领域正在通过改进模型工作方式来释放新功能。研究人员开发了一种名为"SVDquant"的4位量化系统,可以使扩散模型运行速度提高3倍,同时提升图像质量和兼容性。这种技术通过压缩参数和激活值来大幅降低内存和处理需求,为资源受限的系统带来新的可能性。
Meta公司开发了一种机器学习模型SEAMLESSM4T,能够实现36种语言之间的近即时语音翻译。该模型采用创新方法,利用互联网音频片段避免了繁琐的数据标注。这一突破性技术有望简化多语言交流,但仍需解决噪音环境、口音等挑战,并关注技术可能带来的偏见问题。
生物制药行业正积极拥抱人工智能技术,大型企业投入巨资,小型公司谨慎布局。行业面临人才、数据和工作流程等挑战,但预计到2025年将在AI就绪度方面取得实质性进展。AI有望加速药物研发,提高效率,最终造福患者,重塑医疗保健的未来。
随着 AI 需求激增,数据中心行业面临严峻挑战。能源消耗激增威胁可持续发展目标,新项目遭遇公众反对。电力供应和分配方式亟需改革,行业或将迎来动荡的 2025 年。