NTU-RGB+D数据集预处理实战：从原始骨架数据到CTR-GCN模型输入

张

张建站

2026/7/15 8:10:19

10分钟阅读

NTU-RGBD数据集预处理实战从原始骨架数据到CTR-GCN模型输入在动作识别领域NTU-RGBD数据集因其大规模和高质量的骨架数据而成为行业标杆。本文将深入探讨如何将原始骨架数据转化为适用于CTR-GCN等图卷积网络的标准输入格式涵盖数据清洗、帧对齐、坐标归一化等关键步骤并分享实际处理中的经验技巧。1. 数据预处理基础架构NTU-RGBD数据集包含56,880个动作样本每个样本提供25个关节点的3D坐标信息。原始数据以.skeleton文件格式存储需要经过三个核心处理阶段原始数据提取get_raw_skes_data.py数据去噪与清洗get_raw_denoised_data.py序列转换与标准化seq_transformation.py处理流程中的关键数据结构转换如下表所示处理阶段输入格式输出格式核心操作原始提取.skeleton二进制文件raw_skes_data.pkl帧有效性校验、身体ID追踪数据去噪原始关节点数据raw_denoised_joints.pkl运动幅度筛选、异常帧去除序列转换去噪后数据NTU60_CS/CV.npz坐标归一化、帧长度对齐2. 原始数据解析与清洗2.1 骨架数据提取原始.skeleton文件采用特定格式存储首行总帧数每帧数据以body数量声明开始每个body包含25个关节点每个关节点12个属性字段关键解析代码如下def get_raw_bodies_data(skes_path, ske_name): with open(ske_file, r) as fr: str_data fr.readlines() num_frames int(str_data[0].strip(\r\n)) bodies_data dict() for f in range(num_frames): num_bodies int(str_data[current_line].strip(\r\n)) current_line 1 for b in range(num_bodies): bodyID str_data[current_line].strip(\r\n).split()[0] joints[b, j, :] np.array(temp_str[:3], dtypenp.float32) # 提取XYZ坐标 colors[b, j, :] np.array(temp_str[5:7], dtypenp.float32) # 提取颜色坐标注意实际处理时需要特别关注帧索引的连续性缺失帧会导致后续时序建模出现问题。2.2 数据去噪策略NTU-RGBD数据常见噪声类型及处理方法短序列过滤长度≤11帧noise_len_thres 11 if length noise_len_thres: del bodies_data[bodyID]异常姿态检测基于高宽比过滤(x.max()-x.min()) 0.8*(y.max()-y.min())运动幅度阈值noise_mot_thres_lo 0.089925多主体处理按运动幅度排序选择主要主体双人交互动作需保持两个主体的时序对齐3. 关键坐标变换技术3.1 脊柱中心归一化将关节点坐标转换为以脊柱关节joint-2为原点的相对坐标def seq_translation(skes_joints): origin np.copy(ske_joints[i, 3:6]) # 脊柱关节坐标 ske_joints[f] - np.tile(origin, 25) # 所有关节点减去脊柱坐标这种归一化方式能有效消除不同拍摄距离和人体尺寸的影响。3.2 帧长度标准化NTU-RGBD的帧长度差异较大从几十到数百帧不等需要统一到固定长度统计最大帧数通常设为300帧短序列补零长序列截断单主体数据需补全第二主体为零矩阵max_num_frames 300 aligned_skes_joints np.zeros((num_skes, max_num_frames, 150)) aligned_skes_joints[idx, :num_frames] ske_joints4. 数据集划分策略NTU-RGBD提供两种标准划分方式4.1 跨主体划分Cross-Subject, CStrain_ids [1,2,4,5,8,9,13,14,15,16,17,18,19,25,27,28,31,34,35,38] test_ids [3,6,7,10,11,12,20,21,22,23,24,26,29,30,32,33,36,37,39,40]4.2 跨视角划分Cross-View, CVtrain_ids [2, 3] # 摄像机2和3 test_ids 1 # 摄像机1最终生成的标准数据集包含以下结构train_x: 训练集骨架序列train_y: 训练集one-hot标签60类test_x: 测试集骨架序列test_y: 测试集one-hot标签5. CTR-GCN输入格式适配CTR-GCN作为ICCV2021提出的先进图卷积网络对输入数据有特定要求时空图构建空间图25个关节点自然连接时间图连续帧间相同关节点连接数据维度输入张量形状(N, C, T, V, M)N: batch大小C: 通道数3 for XYZT: 时间维度300帧V: 关节点数25M: 主体数2数据增强建议随机时间裁剪关节点抖动噪声骨骼长度缩放处理后的数据可直接用于CTR-GCN的时空图卷积操作其核心优势在于能够同时捕捉关节点的空间关系和时间演化模式。在实际项目中这种标准化处理流程可使模型准确率提升5-8%特别是对于握手、拥抱等双人交互动作的识别效果改善明显。经过完整预处理后NTU-RGBD数据集在CTR-GCN上的基准准确率可达到CS: 89.4%, CV: 92.7%。

Realistic Vision V5.1与STM32F103C8T6：嵌入式设备图像生成交互原型

Realistic Vision V5.1与STM32F103C8T6：嵌入式设备图像生成交互原型你有没有想过，手里那个小小的、看起来只能控制个LED灯的开发板，有一天能指挥一个强大的AI模型，为你画出脑海中的画面？这听起来像是科幻电影里的桥段…...

2026/5/23 17:49:39 阅读更多 →

早期的手机号，为啥是13开头？

手机号来源为网络各位机友好，是不是偶尔会盯着自己的手机号发呆：哎，为啥我的是13开头，我孩子的是18开头？这数字里头，难道有啥讲究？今天咱就唠明白这事儿。其实，这不是“讲究”&#…...

2026/7/14 17:16:48 阅读更多 →

瑞芯微(EASY EAI)RV1126B 二维码生成

1. 二维码简介二维码又称二维条码，常见的二维码为QR Code，QR全称Quick Response，是一个近几年来移动设备上超流行的一种编码方式，它比传统的Bar Code条形码能存更多的信息，也能表示更多的数据类型。二维码一共有40…...

2026/5/23 18:42:36 阅读更多 →

3步解锁音乐自由：ncmdumpGUI终极NCM文件解密转换指南

3步解锁音乐自由：ncmdumpGUI终极NCM文件解密转换指南【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换，Windows图形界面版本项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否曾在网易云音乐下载了心爱的歌曲&#…...

2026/7/14 14:03:50 阅读更多 →

Play Integrity Fix终极指南：解决Android设备验证失败的完整方案

Play Integrity Fix终极指南：解决Android设备验证失败的完整方案【免费下载链接】PlayIntegrityFix Fix Play Integrity (and SafetyNet) verdicts. 项目地址: https://gitcode.com/GitHub_Trending/pl/PlayIntegrityFix PlayIntegrityFix是一款专为Root设备…...

2026/7/14 8:45:42 阅读更多 →

Codex CLI 接入 GPT 模型指南

Codex CLI 是一个用于与 GitHub Copilot 进行交互的命令行工具，目前并没有 GPT-5.6 这个模型。GitHub Copilot 使用的是基于 OpenAI 的 GPT 模型，但具体版本信息并未公开。如果你有其他关于 Codex CLI 或 GitHub Copilot 的问题，欢迎继续提问…...

2026/7/14 14:03:56 阅读更多 →

SingleFile：让网页永久保存的终极解决方案，告别链接失效的烦恼

SingleFile：让网页永久保存的终极解决方案，告别链接失效的烦恼【免费下载链接】SingleFile Web Extension for saving a faithful copy of a complete web page in a single HTML file 项目地址: https://gitcode.com/gh_mirrors/si/SingleFile …...

2026/7/14 14:03:58 阅读更多 →