开放集识别中的不确定性估计:HolUE方法如何统一样本质量与图库模糊性
1. 项目概述为什么开放集识别需要“全盘考虑”不确定性在现实世界的身份识别系统里我们总会遇到一个头疼的问题系统认不认识眼前这个人如果认识他是谁如果不认识系统能不能坦率地说“我不知道”这就是开放集识别Open-Set Recognition, OSR要解决的核心难题。它不像学校里那种“闭卷考试”题库图库里只有已知的、复习过的面孔。OSR更像是一场“开卷实战”随时可能有从未录入过的陌生人未知类别出现系统必须同时完成两项任务准确识别已知成员并果断拒绝未知访客。传统的解决方案比如大名鼎鼎的ArcFace或CosFace依赖于一个“确定性嵌入”模型。简单说就是给每张人脸或每段声音生成一个高维空间里的“特征点”。识别时计算输入样本的特征点与图库中所有已知特征点的“距离”比如余弦相似度。如果最近的距离超过某个阈值就认为是已知的人否则就拒绝。这套流程听起来很清晰但它隐含了一个过于乐观的假设模型生成的每个特征点都是绝对精准、毫无模糊性的。然而现实是骨感的。输入样本的质量千差万别人脸可能模糊、有遮挡、光照诡异声音可能掺杂噪音、断断续续。一个低质量的样本其“特征点”可能会严重偏离它本应在的位置导致系统要么错误地拒绝一个本应认识的熟人False Rejection要么更糟糕把它误认成另一个长得有点像的熟人Misidentification。另一方面即使样本质量完美如果两个人的特征在空间里本来就挨得很近比如双胞胎系统也会陷入“选择困难症”这种因图库类别重叠导致的模糊性同样是巨大的不确定性来源。现有的不确定性估计方法比如PFE、SCF主要关注第一个问题——样本质量。它们通过预测一个概率分布而不仅仅是一个点来表示特征分布的“胖瘦”方差就代表了不确定性方差越大说明模型对这个特征点的位置越没把握。这很好但它只解决了问题的一半。一个高质量的、但恰好落在两个已知类别边界上的样本其概率嵌入的方差可能很小模型很“自信”地把它放在了某个位置但这恰恰是误识别风险最高的时候模型对“位置”很自信但对“这个位置到底属于谁”却非常模糊。这就引出了我们这次要深入拆解的HolUEHolistic Uncertainty Estimation方法。它的核心思想非常直观一个真正可靠的不确定性估计必须同时“看见”样本自身的质量缺陷以及它在已知类别丛林中所处的“危险位置”。HolUE通过一个精巧的贝叶斯概率模型将这两种不确定性来源——嵌入不确定性和图库模糊性——统一到了一个数学框架下。它不改变底层识别模型如ArcFaceSCF的决策而是作为一个轻量的后处理模块为每一个预测附上一个更全面、更可靠的可信度分数。当这个分数很低时系统就可以发出预警“这个判断我不太确定需要人工复核或重新采集数据。”2. 核心原理拆解贝叶斯框架如何统一两种不确定性要理解HolUE我们需要暂时跳出代码和网络结构先看看它背后的数学模型。它的目标是为一个给定的输入样本x计算其后验类别分布p(c|x)。这里的类别c不仅包括图库中的K个已知身份还包含一个代表“未知身份”的连续集合。这个分布越均匀即对所有类别的概率都差不多说明系统越不确定分布越尖锐概率高度集中在某一个类别上说明系统越自信。2.1 贝叶斯分解从直觉到公式HolUE的起点是一个贝叶斯积分p(c|x) ∫ p(c|z) p(z|x) dz这个公式是理解整个方法的关键我们来逐一拆解p(z|x) - 嵌入分布给定样本x模型预测其嵌入向量z的概率分布。这由概率嵌入模型如SCF提供通常是一个冯·米塞斯-费舍尔分布。这个分布的集中参数κ(x)直接反映了样本质量κ越大分布越集中质量越高κ越小分布越分散质量越差不确定性越高。这部分捕捉了“样本自身质量导致的不确定性”。p(c|z) - 给定嵌入的类别分布假设我们已经有了一个确定的嵌入点z这个分布告诉我们这个点属于各个类别包括未知类别的可能性有多大。这完全取决于z在图库已知类别中心之间的相对位置。如果z离某个类别中心µ_c很近且远离其他中心那么p(c|z)就会在该类别上出现尖峰如果z落在几个类别的交界处或者离所有已知类别都很远那么p(c|z)就会变得平缓。这部分捕捉了“图库结构导致的决策模糊性”。积分操作由于我们实际上无法获得一个确定的z而是得到一个分布p(z|x)因此我们需要对这个分布进行积分将z所有可能取值对应的类别可能性“加权平均”起来最终得到综合所有不确定性后的类别分布p(c|x)。注意这个积分在数学上是处理不确定性的标准操作可以理解为“考虑所有可能情况下的平均结果”。在实际计算中HolUE采用了一个合理的近似用嵌入分布的均值µ_x来代替整个分布进行计算这大大简化了计算量且被证明是有效的。2.2 图库感知不确定性GalUE在深入HolUE之前我们先看它的一个关键子模块GalUEGallery-aware Uncertainty Estimation。它假设嵌入是确定的即p(z|x)是一个在µ_x处的狄拉克δ函数只专注于建模p(c|z)即纯粹由图库结构引发的不确定性。GalUE的建模过程如下先验分布p(c)假设已知类别的先验概率均等而未知类别被建模为一个在超球面上的连续均匀分布。这是一个关键且巧妙的设计。如果像传统方法那样把“未知”当作第K1个离散类别那么一个因质量差而漂移到远离所有已知类区域的样本会被非常“自信”地归类为“未知”从而给出低不确定性分数——这掩盖了它本应是“已知但被质量干扰”的事实错误拒绝。而连续均匀分布的假设使得系统对“未知”区域的信念始终是弥散、不确定的从而能正确反映这种模糊性。似然分布p(z|c)对于每个已知类别c假设其嵌入服从以类别中心µ_c为均值、固定集中度κ的冯·米塞斯-费舍尔分布。对于未知类别其嵌入µ°_c在超球面上均匀分布。后验计算利用贝叶斯定理p(c|z) ∝ p(z|c)p(c)可以计算出给定嵌入z后属于各个类别的后验概率。不确定性度量得到后验概率分布后GalUE采用最大后验概率作为不确定性分数q_GalUE(z) max_c p(c|z)。这个值越小说明后验分布越平缓不确定性越高。一个重要的等价性论文附录D证明在适当的参数设置下基于GalUE后验概率的决策规则选择最大概率对应的类别或拒绝如果“未知”概率最高与传统的基于余弦相似度阈值的基线方法是完全等价的。这意味着GalUE在不改变任何识别决策的前提下为每个决策赋予了一个概率解释和不确定性分数这是其作为后处理模块的巨大优势。2.3 从GalUE到HolUE融合样本质量信息GalUE只考虑了“位置模糊”HolUE则要融合“质量模糊”。这就是前面那个积分公式p(c|x) ∫ p(c|z) p(z|x) dz发挥作用的地方。具体计算步骤获取概率嵌入使用SCF等模型输入样本x得到其嵌入分布p(z|x) ~ vMF(µ_x, κ_x)。这里µ_x是嵌入均值κ_x是集中度质量分数。计算近似后验将p(z|x)的均值µ_x代入GalUE计算出的p(c|z)公式中并考虑p(z|x)的影响通过推导详见论文公式4,5得到近似的后验类别概率P(c|x)。计算不确定性分数HolUE没有直接使用后验分布的熵或最大概率而是采用了KL散度D_KL( p(c|x) || p(c) )。这个度量计算了在看到样本x之后我们的类别分布后验p(c|x)相比于最初的“一无所知”状态先验p(c)发生了多大的变化。KL散度越大说明样本x带来了越多的信息减少了不确定性因此识别越可靠KL散度越小说明样本x提供的信息有限后验分布仍然接近均匀先验不确定性很高。分解与校准这个KL散度可以自然地分解为两项KL1主要与p(c|µ_x)相关反映了图库模糊性。KL2主要与log p(µ_x|x)相关而p(µ_x|x) ∝ exp(κ_x)因此KL2与样本质量κ_x强相关反映了嵌入不确定性。后处理与分数归一化直接计算出的KL1和KL2数值尺度可能不同。HolUE使用一个验证集分别对KL1和KL2进行标准化减去均值除以标准差然后将标准化后的两个值输入一个轻量的多层感知机MLP输出一个介于0到1之间的最终不确定性分数q_HolUE。论文也尝试了更简单的加权求和或带温度参数的指数融合但MLP能学习更复杂的交互效果最好。实操心得这个MLP校准步骤非常关键。在实际部署时你需要一个与目标领域分布相近的验证集来拟合这个MLP。它本质上是在学习“如何根据当前任务的数据分布最优地组合图库模糊性和样本质量这两个信号”。如果没有这个校准直接相加的两个KL项可能无法在最终分数上形成有效的错误排序。3. 实现细节与实操要点理解了原理我们来看看如何将一个训练好的ArcFaceSCF模型升级为具备HolUE不确定性估计能力的系统。整个过程是非侵入式的你不需要重新训练主干识别网络。3.1 前置条件与数据准备训练好的嵌入模型你需要一个在目标领域如人脸上训练好的特征提取器例如基于ArcFace、CosFace损失的ResNet。其输出是L2归一化后的特征向量单位超球面上的点。训练好的概率嵌入头在嵌入模型之上你需要附加并训练一个概率嵌入头如SCF。这个头为每个样本x输出两个值嵌入均值µ_x一个d维单位向量和集中度κ_x一个标量。集中度κ_x就是模型对样本质量的估计。图库构建与特征聚合为每个已知身份图库成员准备多个样本如一个人多张照片。使用上述模型提取每个样本的µ_x然后通过某种聚合方式如简单平均得到该身份的模板中心µ_c。对于GalUE/HolUE模型还需要为所有已知类别估计一个共享的集中度参数κ。论文中通常使用一个固定的经验值或在验证集上通过优化识别指标如F1分数来调优。验证集用于校准HolUE最终分数MLP的数据集。它需要包含已知类别和未知类别的样本并且有完整的标签以计算识别错误False Acceptance, False Rejection, Misidentification。这个验证集应尽可能模拟真实应用的数据分布。3.2 算法流程分步解析以下是HolUE不确定性分数的完整计算流程对应论文中的Algorithm 1# 伪代码示意非直接可运行 def compute_holue_score(x, gallery, scf_model, params, val_stats, mlp_model): 计算样本x的HolUE不确定性分数。 参数: x: 输入样本图像或音频 gallery: 图库包含K个已知类别的聚合中心 mu_c 和共享浓度 kappa scf_model: 训练好的SCF概率嵌入模型 params: 超参数如先验概率beta温度T val_stats: 从验证集计算得到的KL1, KL2的均值和标准差 mlp_model: 训练好的用于融合KL1, KL2的轻量MLP 返回: q_holue: 归一化的不确定性分数 (0-1之间越高越不确定) # Step 1: 通过SCF获取概率嵌入 mu_x, kappa_x scf_model.predict(x) # mu_x: 嵌入均值, kappa_x: 集中度质量 # p(z|x) ~ vMF(mu_x, kappa_x) # Step 2: 计算已知类别的似然 p(z|c) for c1...K # 假设gallery中每个类别的中心是 mu_c共享浓度为 kappa log_likelihoods_known [] for mu_c in gallery.mu_centers: # 计算 log p(mu_x | c) 即vMF分布的对数概率密度 log_prob compute_vmf_logpdf(mu_x, mu_c, gallery.shared_kappa) log_likelihoods_known.append(log_prob) # Step 3: 计算先验概率 prior_known (1 - params.beta) / gallery.size_K prior_unknown params.beta # 注意对于连续未知分布其概率密度为 beta / S_{d-1} # Step 4: 计算未归一化的后验概率对已知类别 # 根据公式: P(c|x) ∝ p(mu_x|c) * p(c) unnormalized_posteriors_known [np.exp(lp) * prior_known for lp in log_likelihoods_known] # Step 5: 计算证据 p(z) 用于归一化 # 根据Lemma 1: p(z) (1-beta)/K * sum_c p(z|c) beta / S_{d-1} sum_known_likelihood sum([np.exp(lp) for lp in log_likelihoods_known]) evidence (1 - params.beta) / gallery.size_K * sum_known_likelihood params.beta / sphere_area(dimmu_x.shape[0]) # Step 6: 得到归一化的后验概率已知类别 posteriors_known [up / evidence for up in unnormalized_posteriors_known] # 未知类别的总概率 posterior_unknown 1 - sum(posteriors_known) # Step 7: 应用温度缩放 (Temperature Scaling, T20) # 对后验概率进行温度缩放提升数值稳定性 scaled_posteriors_known temperature_scale(posteriors_known, params.T) # 同时根据Lemma 2的公式计算缩放后未知部分的贡献 # Step 8: 计算KL散度的两个分量 KL1 和 KL2 # KL1: 已知类别部分的后验与先验的KL散度 kl1 compute_kl_divergence(scaled_posteriors_known, prior_known) # KL2: 与样本质量 kappa_x 相关的部分公式涉及 log p(mu_x|x) / p(mu_x) # 其中 p(mu_x|x) ∝ exp(kappa_x * mu_x^T mu_x) exp(kappa_x) (因为mu_x是单位向量) kl2 compute_kl2_component(kappa_x, evidence, params.beta, params.T, gallery.dim) # Step 9: 使用验证集统计量进行标准化 kl1_norm (kl1 - val_stats.kl1_mean) / val_stats.kl1_std kl2_norm (kl2 - val_stats.kl2_mean) / val_stats.kl2_std # Step 10: 通过MLP得到最终不确定性分数 q_holue mlp_model.predict(np.array([kl1_norm, kl2_norm])) return q_holue3.3 关键参数与调优指南先验概率 β代表我们对“遇到未知样本”这件事的先验信念。论文实验表明HolUE在β从0.01到0.99的广阔范围内都非常鲁棒性能变化不大。通常设置为0.5是一个公平且稳健的起点。在安全要求极高的场景期望系统更倾向于拒绝可以适当调高β如0.8在封闭场景已知人群稳定可以调低β如0.2。共享集中度 κGalUE模型中用于已知类别分布p(z|c)的参数。它控制了已知类别在特征空间中的“聚集”程度。κ越大类别分布越集中决策边界越清晰。这个参数需要调优。一个实用的方法是在验证集上固定识别系统的其他参数调整κ使得基于GalUE后验的决策规则达到最优的识别性能如最高的F1分数。温度参数 T主要用于数值稳定。当后验概率非常接近0或1时直接计算KL散度可能导致数值下溢或上溢。温度缩放T1可以平滑概率分布。论文中固定使用T20这是一个经验值通常不需要调整。MLP校准器这是一个小型的神经网络输入是标准化后的KL1和KL2输出是0-1之间的分数。需要在验证集上以“错误检测”为任务进行训练。具体来说将验证集中所有样本根据其是否被错误识别三种错误任意一种打上二分类标签错误1正确0。然后用这个数据集训练MLP目标是让HolUE分数与错误概率正相关。MLP的结构可以很简单比如一个包含若干隐藏层的全连接网络。避坑指南验证集的重要性MLP的校准和KL统计量的计算严重依赖于验证集。务必确保验证集与测试集/真实应用场景同分布。如果分布不一致校准将失效甚至可能带来负面影响。概率嵌入模型的质量HolUE的性能上限受限于其使用的概率嵌入模型如SCF。如果SCF本身对质量估计不准那么KL2分量提供的信号就是有噪声的。因此确保SCF在目标数据集上得到充分训练至关重要。计算开销HolUE在推理时的主要计算成本在于为每个查询样本计算其与所有图库中心µ_c的相似度用于计算p(z|c)。当图库规模K极大时如百万级这部分计算可能成为瓶颈。可以考虑使用高效的向量化计算库或对图库进行索引/聚类来加速。4. 实验分析与效果验证论文在多个数据集和任务上验证了HolUE的有效性我们来看看这些实验告诉了我们什么。4.1 数据集与对比方法数据集领域描述挑战IJB-C, IJB-B人脸识别大规模、无约束环境下的人脸识别基准包含大量姿态、光照、遮挡变化。样本质量差异大身份间相似度高。VoxBlink音频说话人识别大规模开放集说话人识别数据集包含真实环境中的噪音和干扰。音频信号不稳定信道变化多。Whale野生动物识别基于Happywhale竞赛数据构建的新开放集协议识别鲸鱼和海豚个体。类内差异大同一只鲸鱼不同角度类间差异小不同鲸鱼可能相似。对比的基线不确定性估计方法包括PFE/SCF/SF仅基于样本质量概率嵌入的方差/集中度的方法。AccScr基于接受分数的方法q |s(p) - τ|其中s(p)是样本与最近图库类别的相似度τ是决策阈值。它只关注样本是否靠近“接受/拒绝”的决策边界。GalUE本文提出的仅图库感知的方法即HolUE中不考虑p(z|x)的部分。HolUE本文提出的全盘不确定性估计方法。4.2 核心评价指标预测拒绝率如何衡量一个不确定性估计方法的好坏论文采用了预测拒绝率Prediction Rejection Ratio, PRR。这个指标非常直观我们根据不确定性分数对测试样本进行排序从最不确定到最确定。我们逐步拒绝过滤掉一定比例的最不确定样本。每拒绝一部分我们就在剩下的样本上计算识别系统的性能指标如F1分数。绘制一条“拒绝比例-性能指标”曲线。一个完美的Oracle方法会优先拒绝所有出错的样本因此性能曲线会急速上升一个随机的方法则是一条平缓的直线。PRR就是你的方法曲线下的面积相对于随机方法和Oracle方法曲线下面积的归一化值。PRR越接近1说明你的不确定性分数对错误的排序能力越强越能优先过滤掉可能出错的样本。4.3 结果解读与洞见实验的主要结果可以总结为以下几点HolUE全面胜出在所有人脸、音频和鲸鱼识别数据集上HolUE的PRR指标均显著优于所有基线方法。这表明同时考虑样本质量和图库模糊性对于全面捕捉开放集识别中的风险是至关重要的。基线方法的局限性SCF/PFE/SF仅质量它们擅长检测因样本质量低而导致的错误拒绝。一张极其模糊的人脸其κ值会很低不确定性分数很高。但它们完全无法处理错误接受。一个高质量的、但属于未知身份且恰好与某个已知身份很像的样本会被模型“自信”地生成一个方差很小的嵌入从而被赋予低不确定性分数导致系统无法预警。AccScr仅边界它擅长检测错误接受和边界模糊导致的误识别。因为这类样本的接受分数s(p)会非常接近阈值τ。但它对因质量差导致的错误拒绝无能为力。一个质量极差的已知身份样本其嵌入会严重偏离导致s(p)远低于τ系统会非常“自信”地将其拒绝归类为未知从而给出低不确定性分数。GalUE与HolUE的分工与协作GalUE作为HolUE的一部分已经比AccScr更强因为它不仅考虑接受边界还考虑了与所有已知类别的相对位置关系。HolUE GalUE SCF。从拒绝曲线可以清晰看到在过滤初期拒绝不确定性最高的样本性能提升主要来自于SCF成分过滤掉了大量低质量样本减少了错误拒绝在过滤中后期GalUE成分开始发挥主导作用进一步过滤掉了那些质量尚可但身份模糊的样本减少了错误接受和误识别。两者是互补的。对超参数β的鲁棒性实验表明HolUE的性能在β从0.01到0.99的范围内保持稳定。这在实际应用中是个巨大优势意味着我们不需要花费大量精力去精细调整这个先验参数系统默认的0.5就是一个可靠的选择。可视化案例论文中提供了一个非常直观的人脸插值示例。将两张不同人的脸A和B作为图库然后生成一系列从A到B的渐变插值图像作为探测样本。对于中间那些“既像A又像B”的模糊图像SCF给出的不确定性很低因为它只看到了一张“清晰”的人脸。GalUE和HolUE则给出了很高的不确定性因为它们敏锐地察觉到这些嵌入点正好落在两个已知类别的决策边界上。这个例子生动地说明了仅依赖质量估计是多么危险。5. 部署考量与常见问题排查将HolUE集成到现有生产系统中需要考虑一些工程和实践问题。5.1 部署流程与资源评估离线准备阶段训练或获取领域适配的特征提取主干网络如ArcFace ResNet。在其上训练概率嵌入头如SCF。这需要带有质量标注或可通过自监督方式获取质量信号的数据。构建图库为每个注册身份计算聚合嵌入中心µ_c。准备验证集计算KL1和KL2的均值和标准差并训练校准MLP。在线推理阶段对于每个输入样本x前向传播得到µ_x和κ_x。计算µ_x与所有图库中心µ_c的相似度余弦距离。执行GalUE的后验概率计算流程。结合κ_x计算KL1和KL2标准化后输入MLP得到最终不确定性分数q_HolUE。系统根据识别结果如余弦相似度最大是否超过阈值做出决策同时输出q_HolUE作为置信度。可以设定一个二次阈值当q_HolUE高于某个值时即使识别结果超过接受阈值也触发“低置信度警报”。计算开销相比基线系统仅计算余弦相似度HolUE增加的主要开销是计算每个类别的似然p(z|c)涉及K次vMF对数概率计算复杂度O(Kd)其中d是嵌入维度。对于百万级图库这是主要瓶颈。一个小型MLP的前向传播开销可忽略。优化建议对于超大规模图库可以考虑以下策略近似最近邻搜索在计算最大相似度时使用FAISS等库进行加速同时可以只对Top-N个最近邻类别进行精确的似然计算因为远离的类别后验概率几乎为0。预计算常数项vMF分布的对数概率密度中的一些项与输入x无关可以针对每个图库类别预计算并缓存。5.2 典型问题与解决方案问题现象可能原因排查与解决思路HolUE分数普遍偏高大量正确样本被标记为不确定1. 验证集与真实数据分布差异大。2. 概率嵌入模型SCF质量估计整体偏悲观预测的κ_x普遍偏小。3. 图库类别中心µ_c估计不准聚合样本太少或噪声大。1. 检查并重新构建更具代表性的验证集。2. 复查SCF的训练过程和数据确保其学习到了有效的质量信号。可可视化κ_x的分布。3. 增加每个图库身份的注册样本数量或采用更鲁棒的聚合方法如去噪后的平均。HolUE分数无法有效排序错误样本PRR低1. MLP校准器过拟合或欠拟合验证集。2. KL1和KL2的标准化统计量均值、标准差计算有误。3. 共享集中度κ设置不合理。1. 检查MLP在验证集上的校准效果绘制分数与错误率的曲线。尝试调整MLP结构如层数、神经元数或使用正则化。2. 重新计算验证集上的KL1, KL2统计量确保计算过程与推理时完全一致。3. 在验证集上重新调优κ值以优化识别性能F1为目标。系统延迟显著增加图库规模K太大导致O(Kd)的计算成为瓶颈。1. 引入近似计算如仅计算Top-50最近邻的精确似然。2. 考虑对图库进行层次化聚类先粗筛再精算。3. 评估硬件加速GPU矩阵运算是否已充分利用。在某个特定类型错误上表现不佳如能预警错误接受但漏报错误拒绝不确定性分数的融合权重可能失衡。MLP可能过于侧重KL1图库模糊性而忽略了KL2质量。1. 在验证集上单独分析KL1和KL2对各类错误的区分能力。2. 可以尝试在训练MLP时对不同类型的错误样本施加不同的损失权重强制模型关注薄弱环节。跨领域性能下降模型特征提取器、SCF头在新领域上存在域差异。1. 如果可能在新领域数据上进行微调。2. 至少在新领域数据上重新收集验证集并重新计算统计量、训练校准MLP。绝对不要直接套用旧域的校准器。5.3 扩展与展望HolUE框架是灵活且可扩展的不同的概率嵌入模型HolUE不局限于SCF。任何能输出嵌入分布p(z|x)的模型如PFE、ScaleFace都可以作为其“质量感知”模块。不同的主干网络实验表明HolUE在ArcFace、CosFace、HAAML等不同主干网络上都能稳定提升不确定性估计效果说明其与识别模型架构是解耦的。更复杂的先验当前对未知类别的均匀分布先验是一个简化假设。在某些特定场景下如果对未知类别的分布有先验知识例如未知人脸可能集中在特征空间的某些区域可以设计更复杂的先验分布来替代均匀分布可能进一步提升性能。端到端训练目前HolUE是后处理模块。一个未来的探索方向是将这种不确定性估计机制以可微分的方式融入到识别模型的端到端训练中让模型从一开始就学习输出具有良好不确定性校准能力的特征。在我自己的实验和尝试中HolUE最令人印象深刻的地方在于它的可解释性。KL1和KL2两个分量的值可以直观地告诉我们当前样本的不确定性主要来源于“认不清”质量差还是“分不清”长得像。这在调试系统、分析失败案例时提供了极大的便利。例如当一个错误接受发生时如果其HolUE分数高且主要来自KL1那么我们就知道问题出在图库中存在相似性很高的干扰项可能需要考虑引入额外的生物特征维度或人工审核规则。如果主要来自KL2那么问题更可能是输入样本质量太差解决方案是提升前端采集设备的质量或增加重采机制。这种将“不确定性”分解为不同根源的能力是构建真正可靠、可信、可运维的开放集识别系统的关键一步。HolUE不仅告诉你系统“有多不确定”更开始尝试告诉你“为什么不确定”。这无疑是向着更智能、更稳健的机器学习系统迈出的坚实一步。