现如今,大多数自动驾驶汽车都依靠传感器融合,即将毫米波雷达、激光雷达和摄像头的多传感器数据以一定的准则进行分析和综合来收集环境信息。正如自动驾驶汽车行业巨头们所证明的那样,多传感器融合提高了自动驾驶汽车系统的性能,让车辆出行更安全。
但并非所有的传感器融合都会产生相同的效果。虽然许多自动驾驶汽车制造商依靠 "目标级"的传感器融合,但只有集中式传感器前融合才能为自动驾驶系统提供最佳驾驶决策所需的信息。接下来我们将进一步解释目标级融合和集中式传感器前融合之间的区别,以及解释证明集中式前融合不可或缺的原因。
集中式传感器前融合保留了原始传感器数据可做出更精确的决策
自动驾驶系统通常依靠一套专门的传感器来收集关于其环境的底层原始数据。每种类型的传感器都有优势和劣势,如图所示:
优势 |
劣势 |
|
毫米波雷达 |
可在不佳的天气条件下检测远距离的物体 性价比高 |
空间角分辨率差 不能辨别小物体 |
摄像头 |
可使用高清晰度图像和文本数据对物体进行分类检测 性价比高 |
能见度较低的环境下性能差 距离和速度测量性能不佳 |
激光雷达 |
可精确地检测物体的边缘 可生成高清晰的三维图像 |
能见度较低的环境下性能差 维护成本高 价格高 |
融合了毫米波雷达、激光雷达和摄像头多传感器后可最大限度地提升所收集数据的质量和数量,从而生成完整的环境图像。
多传感器融合,相对于传感器单独处理的优势已经被自动驾驶汽车制造商普遍接受,但这种融合的方式通常发生在 “目标级”的后处理阶段。在这种模式下,物体数据的收集、处理、融合和分类都发生在传感器层面。然而,数据综合处理前,单个传感器通过对信息的预先分别过滤,使得对自动驾驶决策所需的背景信息也几乎都被剔除了,这使得目标级融合很难满足未来的自动驾驶算法的需要。
集中式传感器前融合则很好地规避了此类风险。毫米波雷达、激光雷达和摄像头传感器将底层原始数据发送到车辆中央域控制器进行处理。这种方法最大限度地提高了自动驾驶系统获取的信息量,使得算法能够获取全部的有价值的信息,从而能够实现比目标级融合提供更好的决策。
AI增强型毫米波雷达通过集中化处理大幅提升自动驾驶系统的性能
如今,自动驾驶系统已经集中式处理摄像头数据。但当涉及到毫米波雷达数据时,集中化处理仍然是不现实的。高性能的毫米波雷达通常需要数百个天线通道,这就大幅增加了产生的数据量。因此,本地处理就成了一个更具性价比的选择。
然而,安霸的 AI 增强的毫米波雷达感知算法在不需要额外物理天线的情况下,可以提高雷达角分辨率和性能。来自较少信道的原始雷达数据可以通过使用标准汽车以太网等接口,以较低的成本传送到中央处理器。当自动驾驶系统将原始的 AI 增强雷达数据与原始摄像头数据相融合时,它们就能充分利用这两种互补的传感方式来建立一个完整的环境图像,使融合后的结果更加全面,超越任何单一传感器所获得的信息。
毫米波雷达的更新迭代有助于降低成本,也大幅地提高自动驾驶系统的性能。传统的低成本雷达量产时,每个毫米波雷达的价格可以低于 50 美元,比激光雷达的目标成本低一个数量级。与无处不在的低成本摄像头传感器相结合,AI 雷达提供了可接受的精确度,这对大规模商业化的自动驾驶汽车量产至关重要。而激光雷达传感器与运行 AI 算法的摄像头/毫米波雷达感知融合系统相重叠,如果激光雷达的成本逐渐下降,将可作为摄像头 + 毫米波雷达在 L4/L5 自动驾驶系统中的安全冗余。
算法优先的中央处理架构深化传感器融合以优化自动驾驶系统性能
现行的目标级传感器融合有一定局限性。这是因为前端传感器都带有本地处理器,从而限制了每个智能传感器的尺寸、功耗和资源分布,从而进一步限制了整个自动驾驶系统的性能。此外,大量数据处理会快速耗尽车辆的动力并缩短其行驶里程。
相反,算法优先的中央处理架构实现了我们称之为深度、集中式的传感器前融合。该技术利用最先进的半导体工艺节点优化了自动驾驶系统的性能,这主要是因为该技术在所有传感器上动态分布的处理能力,以及能根据驾驶场景提升不同传感器和数据动向的性能。通过获取高质量、底层原始数据,中央处理器可以做出更智能、更准确的驾驶决策。
自动驾驶汽车制造商可以使用低功耗毫米波雷达和摄像头传感器,并结合尖端的算法优先的特定应用处理器,如安霸最近宣布的 5 纳米制程 CV3 AI 大算力域控制芯片,具备最佳感知和路径规划性能、具有最高的能效比,显著增加每辆自动驾驶汽车行驶里程的同时,降低电池消耗。
不要抛弃传感器——投资于它们的融合
自动驾驶系统需要多样化的数据才能做出正确的驾驶决策,只有深度、集中式的传感器融合才能提供最佳自动驾驶系统的性能和安全所需的广泛数据。在我们的理想模型中…
集中式传感器前融合可以改进现有的高层级融合架构,让使用传感器融合的自动驾驶汽车强大而可靠。为了获得这些好处,自动驾驶汽车制造商必须投资算法优先的中央处理器,以及支持 AI 的毫米波雷达和摄像头传感器。通过多方努力,AI 制造商可以迎来下一阶段的自动驾驶汽车发展的技术变革。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。