CVPR 2026 | 超越传统检索方法！LEADER：激光雷达重定位精度和效率双丰收

张

张建站

2026/5/5 18:24:17

10分钟阅读

CVPR 2026 | 超越传统检索方法！LEADER：激光雷达重定位精度和效率双丰收

点击下方卡片关注“CVer”公众号AI/CV重磅干货第一时间送达点击进入—【顶会/顶刊】投稿交流群添加微信号CVer2233小助手拉你进群扫描下方二维码加入CVer学术星球可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料及应用发论文/搞科研/涨薪强烈推荐转载自机器之心在自动驾驶的日常测试视频里我们常能看到这样的场景一辆无人车驶入幽深的地下车库GPS 信号瞬间罢工它只能靠激光雷达扫描周围环境试图弄清楚 “我在哪”。然而车辆可能已经原地掉头拐过了好几个弯周围只有冰冷的墙壁和立柱。就像你蒙上眼睛转了几圈再睁开眼面对一片空白的天花板要准确说出自己面对的方向和所处的位置。激光雷达重定位要解决的正是这个难题仅凭一帧点云片段估计出自己在全球坐标系中的 6 自由度位姿。目前主流方法遵循 “检索 - 配准” 范式其精度可达分米级但其存储和计算压力会随场景规模急剧膨胀另一种使用神经网络直接预测位姿的方法包括 APR 和 SCR可实现十毫秒级的迅速响应但其对角度敏感精度仅在亚米级。就像天平的两端精度和效率似乎难以兼得但我全都要厦门大学、布里斯托大学联合提出激光雷达重定位方法 LEADER不仅实现十毫秒级的 “睁眼” 即定位而且精度超越传统的 “检索 - 配准” 方法这项工作已被 CVPR 2026 接收为 Highlight代码和模型将全面开源论文标题LEADER: Learning Reliable Local-to-Global Correspondences for LiDAR Relocalization论文链接https://arxiv.org/abs/2604.11355仓库链接https://github.com/JiansW/LEADER从效率专长到效率性能两开花场景坐标回归SCR方法在预测位姿时不需要显式存储地图而是使用神经网络预测场景点的世界坐标再通过 RANSAC 类方法预测当前的位姿。由于采用了 RANSAC 类几何约束在稳定性方面通常优于绝对位姿回归APR方法。相比传统的 “检索 - 配准” 模式SCR 省去了显式存储点云特征的开销也不会因地图增大导致存储和计算成本飙升。但长期以来SCR 方法精度维持在米级到亚米级和 “检索 - 配准 “方法相比呈现明显的劣势。于是作者提出了一个问题SCR 方法精度上真的无法比拟 “检索 - 配准” 方法吗这是论文出发的核心既然 SCR 在存储开销和计算延迟上都存在明显的优势如何让其在保留这些优势的基础上精度比肩甚至超越 “检索 - 配准” 方法作者发现有两个明显影响 SCR 精度的因素旋转敏感汽车在行驶过程中如果转个弯精度会大幅下降甚至会从亚米漂移到 10m 开外退化区域环境中存在大量的噪声和重复结构区域比如长直走廊、空旷的地面等。要在这些高度相似的区域中找到其对应的世界坐标就像让人盯着白墙找指纹只会输出一堆 “幻觉对应”。图 1LEADER 框架图LEADER让点云 “转不晕”让坏点 “靠边站”作者提出的 LEADER 框架用以下几乎零开销的组件解决了以上痛点柱面投影循环稀疏卷积Spatial Transformation Cartesian Recovery在自动驾驶中旋转问题往往集中在偏航角上。因此作者将点云进行柱面投影并辅以循环稀疏卷积来处理角度衔接的问题从而实现对偏航角不变的特征不管车头朝南还是朝北都拥有同一套稳定表示。此外通过检测地面点来将点云校正至水平获得了一定的俯仰角和横滚角鲁棒性。TRR 损失Truncated Relative Reliability Loss每个点的质量不同预测的难易程度差距很大但我们不可能为场景中的每个点去人工标注质量信息。实际上哪些点难以预测模型在训练时就已经 “告诉” 我们了那就是每个点训练时的欧氏距离损失。因此在预测世界坐标的同时作者还让模型预测每个点 “好不好预测”即 “置信度”。对于容易预测的点置信度更高反之则低。那么如何让模型在无置信度相关真值的情况下实现置信度的预测呢作者设计了以下的 TRR 损失等号右侧的求和符号内是每个点的训练权重 w 和其欧氏距离损失 L 相乘。而训练权重则是由置信度归一化得到的这就相当于给模型指明了一条路如果某个点很难精准预测即损失很难下降那么模型可以给其输出一个很低的置信度这样该点的训练权重就会降低最终降低总损失。而在置信度归一化的过程中作者限制了其范围这避免置信度范围过大从而出现模型只专注于学习少数点的问题。在 RANSAC 阶段作者选择高置信度的点来拟合位姿进一步削弱了 “坏点” 的影响。实验结果全面领先在 NCLT 数据集上LEADER 大幅超越了当前的隐式神经网络方法APR 和 SCR定位精度从 APR 的 1.19 m 和 SCR 的 1.51 m 提升至 0.31 m表 1NCLT 数据集上的实验结果作者还与同样具有旋转鲁棒性的 “检索 - 配准” 方法 RING/RING 进行了对比并取两种方法中最优值作为参考。在同样 xy 平面上的定位精度中LEADER 的平均定位精度达到 0.28 m大幅超越了 RING/RING 方法5 m 内的失败率仅 0.28%不到 RING/RING 失败率的 1 / 25甚至在基本不受失败率影响的中位数上LEADER 的 0.21 m 也明显领先表 2与 “检索 - 配准” 方法的对比结果置信度分析让模型学会 “有所取舍”在 NCLT 数据集上旋转问题并不突出为什么 LEADER 仍然有如此大的提升TRR 损失引入了置信度信息作者对该模块进行了分析首先对测试集中所有点按其置信度进行了排序并绘制了点的置信度和预测误差之间的关系图 2点置信度与预测误差的关系可以看到两者呈现明确的反相关说明在预测阶段置信度信息非常有效。而预测阶段仅使用置信度高的点也进一步排除了 “坏点” 的影响。作者还将 TRR 和常规的欧式距离损失进行了对比图 3TRR 模块的消融实验结果表明TRR 损失不仅能让模型在训练中自适应调整每个点的权重从而实现置信度预测而且使预测出的高精度点的比例翻倍。后记这给了我们一个启示在并不需要完整记忆所有内容的场景中与其让模型去死记硬背那些难以学习的数据不如让模型自己选择应该记住什么。因为参数一旦确定模型的记忆容量就是固定的“坏点” 会消耗模型大量的容量去尝试记住它们结果不仅记不住反而会干扰训练影响 “好点” 的数量。有时候模型并非越复杂越有效核心模块往往恰恰是其中简单的部分如果能分析出模型的瓶颈因素并为其 “引流”即可能引发质变简约而不失优雅。作者介绍本文第一作者来自厦门大学信息学院空间感知与计算实验室ASCLab2023 级硕士生吴建实通讯作者为厦门大学敖晟助理教授并由朱明航、刘敦强、李文布里斯托大学、沈思淇副教授、温程璐教授、王程教授共同合作完成。研究团队长期聚焦定位相关的算法研究。实验室主页https://asc.xmu.edu.cn/本文系学术转载如有侵权请联系CVer小助手删文何恺明在MIT授课的课件PPT下载在CVer公众号后台回复何恺明即可下载566页课件PPT大家赶紧学起来CVPR 2026 所有论文和代码下载在CVer公众号后台回复CVPR2026即可下载CVPR 2026 所有论文和代码CV垂直方向和论文投稿交流群成立扫描下方二维码或者添加微信号CVer2233即可添加CVer小助手微信便可申请加入CVer-垂直方向和论文投稿微信交流群。另外其他垂直方向已涵盖目标检测、图像分割、目标跟踪、人脸检测识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。一定要备注研究方向地点学校/公司昵称如Mamba、多模态学习或者论文投稿上海上交卡卡根据格式备注可更快被通过且邀请进群▲扫码或加微信号: CVer2233进交流群 CVer计算机视觉知识星球人数破万如果你想要了解最新最快最好的CV/DL/AI论文、实战项目、行业前沿、从入门到精通学习教程等资料一定要扫描下方二维码加入CVer知识星球最强助力你的科研和工作 ▲扫码加入星球学习▲点击上方卡片关注CVer公众号整理不易请点赞和在看

$终极指南：5步快速掌握重庆大学毕业论文LaTeX模板CQUThesis$

终极指南：5步快速掌握重庆大学毕业论文LaTeX模板CQUThesis

终极指南：5步快速掌握重庆大学毕业论文LaTeX模板CQUThesis 【免费下载链接】CQUThesis :pencil: 重庆大学毕业论文LaTeX模板---LaTeX Thesis Template for Chongqing University 项目地址: https://gitcode.com/gh_mirrors/cq/CQUThesis 重庆大学毕业论文LaT…...

2026/5/5 18:18:28 阅读更多 →

在 Taotoken 平台观测多模型 API 调用的延迟与稳定性表现

在 Taotoken 平台观测多模型 API 调用的延迟与稳定性表现 1. 多模型调用的可观测性需求当业务系统依赖大模型 API 时，开发者不仅需要关注功能实现，还需持续监控接口的响应质量。Taotoken 平台为聚合多模型供应商的调用提供了统一观测入口，…...

2026/5/5 18:17:27 阅读更多 →

自参考强化学习SRPO在多模态任务中的高效优化

1. 项目背景与核心价值去年在开发智能机器人控制系统时，我遇到了一个典型难题：传统强化学习模型在视觉-语言-动作多模态任务中，需要消耗大量计算资源进行试错训练。直到接触到自参考强化学习(Self-Referential Reinforcement Learning)这个新…...

2026/5/5 18:14:28 阅读更多 →

UVa 173 Network Wars

题目分析本题设定在 212621262126 年，彗星 Swift‑Tuttle\texttt{Swift‑Tuttle}Swift‑Tuttle 撞击地球后，网络中的部分链接被切断，同时一些 AI\texttt{AI}AI 程序发生了变异。两个程序 Paskill\texttt{Paskill}Paskill 和 Lisper\texttt{…...

2026/5/5 10:29:12 阅读更多 →

MA-EgoQA：多智能体第一视角视频问答基准解析

1. 项目背景与核心价值在计算机视觉与自然语言处理的交叉领域，视频问答（VideoQA）一直是极具挑战性的研究方向。而当我们把视角聚焦在第一人称视频（Egocentric Video）时，问题会变得更加复杂——这类视频通常…...

2026/5/5 10:29:14 阅读更多 →

别再死记硬背DDR4时序参数了！用Python脚本自动解析JESD79-4标准文档，生成你的专属配置表

用Python解放DDR4开发：从JESD79-4标准文档自动生成配置工具当第一次打开JESD79-4标准文档时，大多数硬件工程师都会感到一阵眩晕——数百页的技术规范、错综复杂的时序参数、晦涩难懂的寄存器配置，这些内容不仅难以记忆，更在具体项…...

2026/5/5 10:29:15 阅读更多 →

Adobe扩展安装难题如何解决？ZXPInstaller让.zxp文件安装变得智能高效

Adobe扩展安装难题如何解决？ZXPInstaller让.zxp文件安装变得智能高效【免费下载链接】ZXPInstaller Open Source ZXP Installer for Adobe Extensions 项目地址: https://gitcode.com/gh_mirrors/zx/ZXPInstaller 还在为Adobe扩展安装而头疼吗？A…...

2026/5/5 10:29:17 阅读更多 →