激光雷达(Lidar)技术此前已被用于探测隐藏在转角后方的物体,但这项能力长期依赖价格高昂的实验室级设备。一项最新研究表明,售价不足100美元的消费级智能手机激光雷达同样能够实现转角成像。
麻省理工学院媒体实验室博士生Siddharth Somasundaram表示,这一突破蕴含广泛的应用潜力。"在自动驾驶领域,转角感知技术可以帮助自动驾驶汽车在其他车辆、骑行者或行人进入直接视野之前就完成探测,从而提升盲区路口和遮挡路段的行驶安全性。在机器人领域,该技术则可协助机器人在杂乱或局部遮挡的环境中完成导航。"
Somasundaram还强调了这项研究更深远的意义:"我们认为最重要的影响在于技术的普及化。当此类技术变得触手可及,人们往往会发现远超原始研究者预想的应用场景。"目前,研究团队已公开发布了实现这一功能所需的全部代码。
激光雷达的工作原理与感知局限
激光雷达正日益为自动驾驶汽车、无人机、机器人和智能手机赋予三维扫描能力。其传感器的工作方式类似雷达利用无线电波的原理——向目标位置发射激光,并通过分析反射脉冲的返回时间来计算距离,进而生成三维空间地图。
通过分析从反射面弹回的激光脉冲,激光雷达可以"看见"不在直接视线范围内的物体,例如隐藏在转角后方的目标。然而,最初实现此类非视线成像的方案"依赖极为专业的科学设备,造价通常在50万至100万美元之间",Somasundaram指出,"这些系统体积庞大、造价高昂,只能在实验室环境中使用。"
消费级传感器的意外潜力
随着时间推移,单光子探测器等高性能传感器开始出现在消费电子产品中。Somasundaram表示:"当我们开始对这些传感器展开实验时,意识到即便是现成的消费级设备,实际上也在捕捉微弱的转角信号。"
然而,能够捕捉信号并不等同于可以真正用于非视线成像。消费级激光雷达出于眼部安全考量,通常采用低功率激光,采集的图像往往噪点较多;同时,此类设备的传感器分辨率相对较低;此外,相机与目标物体的移动也会造成图像模糊。Somasundaram坦言:"确实有过一些时刻,我们不确定有意义的成像是否真的可行。"
多帧融合算法破解难题
为克服上述挑战,研究团队没有基于单帧图像数据尝试非视线成像,而是转向同时分析多帧图像的策略。他们从智能手机相机连拍功能中获得灵感——连拍可通过合并多张照片来提升画质;同时借鉴了卫星成像中合成孔径雷达的原理——该技术通过融合多个天线的信号,达到单一大型天线的成像质量。
"一旦我们开发出能够跨帧整合信息的算法,隐藏信号便开始更加清晰地浮现出来。"Somasundaram说道。
实验结果与现实局限
研究团队在实验中使用了一套便携式智能手机激光雷达系统,该系统约有100个像素点,每个像素点均由激光发射器与单光子探测器组合而成。借助该系统,他们成功重建了静止隐藏物体的三维图像,并追踪了已知形状隐藏物体的三维运动轨迹。此外,他们还能利用隐藏物体作为地标来精确定位激光雷达传感器的位置——这一能力对于机器人在缺乏纹理特征的环境中保持定向具有重要价值,而此类环境恰恰是机器人导航的难题所在。以上成果均在无需专业标定的条件下实现。
Somasundaram表示:"令我最感意外的是,这些消费级激光雷达系统竟然能从转角处捕捉到任何有用的信号。光线经过多次反射后抵达传感器时已极为微弱,而这些设备的设计初衷根本不包含此类成像需求。能够证明其中蕴含足够的信息来重建和追踪隐藏物体,对我们来说是非常令人振奋的发现。"
不过,他也提醒外界不要将该系统想象为"能够生成隐藏场景完整照片的装置。目前系统从极微弱的信号中恢复的,只是稀疏的几何与运动信息",与人们日常使用手机拍摄的高像素细节图像之间,"仍存在相当大的差距"。
未来研究方向
现有系统假设物体的形状和运动在帧与帧之间保持相对一致,"这使我们能够将大量极微弱的测量值合并为更强的信号",Somasundaram解释道。但他同时指出,这一假设在某些情况下可能失效:例如人体姿势发生变化、物体被遮挡导致形状和运动看似改变,或激光雷达传感器本身出现突然移动等。
"降低系统对这些假设的依赖程度,是未来工作的重要方向之一。"他表示,更优化的物理模型、信号处理方法以及机器学习技术,"有望帮助系统适应更复杂的运动和场景动态。随着时间推移,我们期望这些方法能让转角感知在真实、无约束的环境中更加稳健可靠。"
在硬件层面,研究团队也着眼于对激光雷达设备本身进行改进。Somasundaram指出:"目前消费级激光雷达系统主要针对常规视线成像和深度感知而设计。如果未来的激光雷达硬件在设计之初就同时考虑可见场景与隐藏场景的理解需求,结果将会如何?提升传感器灵敏度、分辨率、扫描策略或光学设计,都有望显著改善非视线成像性能。"
相关研究成果已于5月20日在线发表于《自然》期刊。
Q&A
Q1:消费级激光雷达为什么之前无法用于转角成像?
A:消费级激光雷达主要面临三大障碍:第一,出于眼部安全考量使用低功率激光,导致采集图像噪点多;第二,传感器分辨率较低;第三,相机与目标物体的移动会造成图像模糊。这些因素共同导致捕获的转角信号极为微弱,难以用于实际成像。
Q2:MIT的研究团队用什么方法解决了信号噪声问题?
A:研究团队的核心突破在于放弃依赖单帧图像进行成像,转而同时分析多帧图像。他们受到智能手机连拍合成以及卫星合成孔径雷达技术的启发,开发出能够跨帧整合信息的算法,将多个极微弱的测量值叠加融合,使隐藏物体的信号得以更清晰地呈现。
Q3:转角激光雷达技术目前有哪些实际应用局限?
A:目前该系统恢复的只是稀疏的几何与运动信息,尚无法生成完整清晰的隐藏场景图像。此外,系统依赖物体形状与运动在帧间保持一致的假设,当人体改变姿势、物体被遮挡或传感器本身突然移动时,该假设可能失效,导致成像效果下降。
好文章,需要你的鼓励
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
随着医疗数据数字化与互操作性的进步,跨机构纵向患者数据的研究应用成为可能。本研究通过对20位领域专家的访谈,识别出8种数据收集方法,涵盖智能手机应用、结构化数据导出、区域/全国研究查询及聚合数据源等。研究发现,各方法均有其优缺点,无单一最优方案。参与者中介交换方式可绕过复杂治理安排,但存在数据缺口;全国性网络尚不支持研究查询。公共政策的持续推进将对该领域发展起关键作用。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。