仿人机器人视觉与运动技术的精细调校

仿人机器人与自动驾驶汽车在区域架构、功能安全及雷达传感方面高度相似。多分辨率摄像头组合可更好地模拟人类视野,兼顾广角低保真与局部高精度需求。自然运动需实时计算正逆运动学、距离与深度,同时须兼顾功耗效率。当前视觉与基础操控技术最为成熟,而触觉、全身协调及非结构化环境中的移动能力仍是主要挑战。业界正借鉴自动驾驶经验,加速推进仿人机器人的规模化落地。

仿人机器人若要在人类身边安全运作,无论是在医院还是家庭环境中,都仍有很长的路要走。摄像头和雷达虽然能提供良好的视觉感知,但容错空间极为有限,尤其是在儿童和老人附近。随着自动驾驶汽车已在城市道路上部署,机器人开发者正在汲取其边缘案例中的经验教训,构建更完善的视觉与运动技术以规避事故。

仿人机器人是物理AI的一种形态,从高级计算到微型传感器,各个层面的技术都在持续推进,以期这些系统能尽快实现大规模部署。

英飞凌科技电源与传感器系统部门总裁Adam White指出:"机器人可以拆解为许多组成部分,从主计算单元到区域控制、电机控制、电池、充电及环境感知系统。机器人与汽车有若干相似之处,包括区域控制架构。例如,微控制器可能需要满足功能安全(FuSa)要求,可能还需要特殊的以太网接口。电机控制方面,使用氮化镓(GaN)器件可以缩小关节尺寸,同时延长电池续航。在环境感知领域,我们正在大量开发参考设计,为集成商和机器人公司提供最优传感器方案——无论是雷达这类视觉传感器,用于气体检测的CO?或其他传感器,还是触觉感知用的电容式传感器。"

机器人的系统级架构在很大程度上借鉴自自动驾驶汽车,前端是感知套件,通常至少包含摄像头。

Cadence Tensilica产品汽车产品管理总监Amit Kumar表示:"大多数整车厂会额外集成雷达,以弥补摄像头在夜间或低光照条件下的局限,部分车型还会引入激光雷达。展望未来,热成像传感器也将被引入以增强夜间驾驶的冗余性。机器人与此类似,同样需要在复杂的天气和光照条件下运行,因此这些传感器不可或缺。不过,当机器人采用仿人形态时,还需要考虑更多感知维度。"

这些额外维度涵盖麦克风(语音)、触觉/触力感知,以及未来可能出现的气味传感器阵列。

安全性是汽车与机器人领域最重要的交汇点之一。Imagination Technologies产品管理总监Matthew Bubis表示:"无论是工业机器人、仿人机器人、机械臂,还是外形与人类毫无相似之处的复杂机器人,都有安全方面的影响。这些机器体型较大、存在一定危险性,需要处理来自多种摄像头输入和激光雷达类技术的复杂数据。这使得机器人与汽车芯片设计高度重叠。我们看到客户从汽车芯片设计起步,为机器人应用做准备,同时也在思考是否需要基于大语言模型构建链式推理系统,以及是否需要沿用汽车GPU的安全标准。"

目前,机器人行业正在观察哪种形态和应用场景会率先普及。Bubis表示,芯片设计企业一边通过汽车业务维持运营,一边期待与之合作的机器人初创公司在解决机械与AI软件挑战后迎来量产订单,这一过程可能需要五年时间。

视觉感知

尽管工程界已在自动驾驶视觉领域投入了大量研发资源,但仍存在持续改进的空间,仿人机器人因与人类距离更近而有其特殊需求。

Synaptics物联网与边缘AI处理器业务副总裁John Weil表示,消费级视觉系统正在引领方向,工业领域将快速跟进。多摄像头融合是当前的重要趋势:"最简单的方式是用低分辨率摄像头持续扫描,快速处理大量数据,一旦识别到重要目标,再同步至高分辨率摄像头进行精细分析。你可以用一台摄像头快速检测物体,再用另一台在同一视野内以不同色彩空间、更高分辨率拍摄。"

多摄像头协同工作的逻辑与人眼感知机制高度相似——人眼中心区域分辨率高,周边视野较低。Weil指出:"我们将看到大量宽视野、低精度的摄像头与高精度、小范围摄像头并存的方案。多模态意味着多个摄像头以不同精度对齐融合各类信息。"

工业机器人方面,摄像头是检测、质量控制和计数的主要感知手段,但也存在局限性。德州仪器机器人与工业自动化总经理Giovanni Campanella指出:"在黑暗环境、烟雾或粉尘环境,或对超高速运动物体拍摄时,摄像头表现不佳。引入雷达等传感器并进行传感器融合,可以弥补这些盲点,ASIL认证的雷达设备能够以故障安全的方式,在机器人周围创建一个安全泡,准确探测儿童等易受伤害群体。"

Synopsys产品管理总监Matt Commens补充道,机器人视觉还借鉴了汽车的电磁雷达技术:"当摄像头因强光无法正常工作时,电磁波仍能'看清'周围环境。此外,视觉仿真工具不仅能模拟光照物理特性,还能模拟人眼对光的非线性感知,帮助设计者预判真实场景下的视觉效果。"

运动控制

仿人机器人从自动存取系统(ASRS)进化到自主移动机器人(AMR),下一阶段是通用型机器人。AI与边缘计算的结合,正在推动机器人实现更自然的运动。

Addverb杰出科学家Tapan Pattnayak描述了这一挑战:"人类捡起物体时,并不会显式计算正运动学、逆运动学、距离和深度,而是凭借持续的直觉性智能来调整身体姿态。这正是我们现在要攻克的物理AI核心问题。"

德州仪器的Campanella认为,硬件与软件各占50%的重要性:"硬件包括传感器、电机驱动和执行器,尤其是手部可能有多达30个执行器;软件则将一切整合在一起。"

能效管理

为机器人提供高效的能源供应是另一大挑战。Siemens EDA产品负责人Sathishkumar Balasubramanian指出:"如果机器人每运行10分钟就需要更换电池,这显然不可行。能源将是最大的问题。"

Synaptics战略与业务发展高级总监Nebu Philips表示,机器人最大的功耗来源是电机而非芯片:"在这类设备上,硅片本身并非主要功耗驱动。但对于触觉等感知功能,低功耗非常重要,高效的传感可以延长机器人续航。"

Imagination的Bubis也指出,低功耗需求甚至影响到数据类型的选择:"更低精度的数据类型意味着更低的功耗、更小的内存和更小的芯片。"

嗅觉与味觉

人类的嗅觉和味觉不仅带来感官享受,更是判断食物安全和规避有毒气体的重要工具。这些场景正是机器人大有用武之地的领域。

Cadence的Kumar展望道:"随着机器人更深度地融入日常生活,嗅觉传感模态将逐步兴起。具有多样化灵敏度特征的气体传感器阵列,结合针对人类常见气味训练的神经网络模型,有望在机器人中实现基本的嗅觉功能。"

哈佛大学工程与应用科学学院研究生Haritosh Patel的团队开发了一款电子鼻,能够检测多种气体,通过CPU上的微型风扇"主动嗅探",并利用MCU进行AI/ML处理。Patel介绍了其应用场景:"这种电子鼻可以引导消防员找到被困人员,规划化学风险更低的安全路径,而这条路径未必是最短路径。"

在工业环境中,移动机器人搭载气体传感器后,可以比固定传感器或人类更安全地靠近泄漏点。至于味觉传感,目前相关研究主要集中于咖啡、葡萄酒、奶酪等高价值食品的品质分析,以及医药配方领域。

结语

要与人类安全共存,仿人机器人需要出色的视觉感知、精准的运动计算,以及在不过度消耗电能的前提下实现自然流畅的动作。仿人机器人与自动驾驶汽车有诸多相似之处,但其复杂度更高。

Synopsys的Commens总结道:"汽车接收大量传感器信息后只需控制刹车和转向,机器人面临同样的决策需求,却有更多运动自由度,且工作环境比道路复杂得多。"随着运动能力的成熟和全维度感知的逐步实现,仿人机器人的应用场景将从工业检测一路延伸至品酒师、老人护理等更广泛的领域。

Q&A

Q1:仿人机器人的视觉系统是如何实现的,为什么要用多个摄像头?

A:仿人机器人通常采用多摄像头融合方案,模仿人眼的感知特性。低分辨率宽视野摄像头负责快速扫描环境,识别到重要目标后再调用高分辨率摄像头进行精细分析。此外,在黑暗或烟雾等摄像头失效的场景下,还会引入雷达传感器进行补充,形成多模态感知融合,确保机器人在各种复杂环境下都能"看清"周围世界。

Q2:仿人机器人的运动控制为什么那么难实现?

A:仿人机器人实现自然运动需要实时计算正运动学、逆运动学、距离和深度,同时还要高效使用电能,不能快速耗尽电池。更深层的挑战在于,人类的运动依靠的是持续的直觉性智能,而非逐步的数学计算。如何让机器人像人类一样"感知—判断—行动",是物理AI目前正在攻克的核心难题。

Q3:仿人机器人的电子鼻技术现在发展到什么程度了,有哪些实际应用?

A:哈佛大学研究团队已开发出能检测多种气体的电子鼻原型,通过微型风扇主动采样,结合MCU进行AI/ML处理。目前已验证的应用场景包括:协助消防员在危险建筑中找到被困人员,并规划化学风险更低的营救路径;在工业环境中探测气体泄漏。未来结合神经网络模型,电子鼻有望在机器人中实现接近人类水平的嗅觉识别能力。

来源:Semiconductor Engineering

0赞

好文章,需要你的鼓励

2026

07/02

17:39

分享

点赞

邮件订阅