机器学习评价指标之综合指标的关系

张

张建站

2026/5/23 0:01:16

10分钟阅读

综合指标的关系宏平均考虑每个类别的个别表现并对它们的评价指标比如准确率、召回率等进行平均。每个类别被视为同等重要无论类别的大小或样本数量。微平均则关注整体表现它将所有类别的预测结果合并起来计算一个总的评价指标。在微平均中每个样本的预测都被视为同样重要不管它属于哪个类别。假设我们有一个三类分类任务A、B 和 C。如果类别 A 有很多样本而类别 B 和 C 的样本很少在宏平均中由于每个类别的指标会平均起来因此对于这种样本不平衡的情况相对较稳健不会因为类别 A 的样本数量多而对其产生特别大的影响。而在微平均中每个样本都被视为同等重要不论它属于哪个类别。因此样本多的类别会对整体性能产生更大的影响从而导致微平均对于样本数量较多的类别更为敏感。也就是说类别 A 会在微平均中对性能评估产生较大影响有可能会掩盖其他类别的表现。在样本不平衡的情况下引入加权平均会赋予样本多的类别更大的权重从而在评价指标中更好地体现这些类别的影响。虽然加权平均考虑了每个类别的贡献但是如果样本非常不平衡的情况下加权平均反而因为强调了某个类别而加剧样本不平衡问题。总结以上介绍的评价指标的选择和使用不依赖于具体的训练策略它们都可以帮助我们了解整体性能以及各个类别的表现。无论是直接训练多分类模型还是使用多个二分类模型来辅助进行分类我们都可以使用宏平均、微平均和加权平均来计算评价指标以得到全局性能的衡量。

CANN/pypto copysign函数API文档

# pypto.copysign 【免费下载链接】pypto PyPTO（发音: pai p-t-o）：Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto 产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A…...

2026/5/22 23:59:39 阅读更多 →

novm 设备模型详解：VirtIO 与现代硬件虚拟化技术

novm 设备模型详解：VirtIO 与现代硬件虚拟化技术【免费下载链接】novm Experimental KVM-based VMM for containers, written in Go. 项目地址: https://gitcode.com/gh_mirrors/no/novm novm 是一个基于 KVM 的实验性容器虚拟化管理程序（VMM&am…...

2026/5/22 23:58:05 阅读更多 →

Vibe Vibe快速入门：10分钟创建你的第一个AI网页应用实战指南

Vibe Vibe快速入门：10分钟创建你的第一个AI网页应用实战指南【免费下载链接】vibe-vibe The First Systematic Vibe Coding Open-Source Tutorial | From Zero to Full-Stack, Empowering Everyone to Build Products with AI | Live at: www.vibevibe.cn &#xf…...

2026/5/22 23:57:14 阅读更多 →

在Taotoken模型广场中根据场景选择合适的模型

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度在Taotoken模型广场中根据场景选择合适的模型面对众多大模型厂商和琳琅满目的模型，开发者常常面临选择困难&#xff1…...

2026/5/22 17:26:41 阅读更多 →

Agent 一接流式 API 就开始响应断层：从 Delta Parsing 到 Final Assembly 的工程实战

很多开发者以为 Agent 接入流式 API 只是"开个 SSE 连接、逐字渲染"这么简单。直到生产环境报错：用户的话说到一半突然断层，工具参数在流中被截成两半，多轮对话上下句粘在一起。这些问题不是网络抖动，而是 Delta 解析和…...

2026/5/21 11:19:54 阅读更多 →

ESP-SR语音识别框架深度剖析：高性能嵌入式唤醒词与命令识别解决方案

ESP-SR语音识别框架深度剖析：高性能嵌入式唤醒词与命令识别解决方案【免费下载链接】esp-sr Speech recognition 项目地址: https://gitcode.com/gh_mirrors/es/esp-sr ESP-SR是乐鑫推出的高性能嵌入式语音识别框架，专为资源受限的物联网设备设计…...

2026/5/22 17:51:20 阅读更多 →