从字典扩容到高位进位加法：图解Redis SCAN命令的底层遍历原理

张

张建站

2026/5/14 12:09:44

10分钟阅读

从字典扩容到高位进位加法图解Redis SCAN命令的底层遍历原理Redis的SCAN命令是开发者工具箱中不可或缺的利器尤其当面对海量键值对的遍历需求时。与简单粗暴的KEYS命令不同SCAN通过精妙的高位进位加法算法和渐进式处理策略在保证性能的同时避免了服务阻塞。本文将深入Redis字典结构的核心设计揭示SCAN命令如何优雅应对扩容缩容场景以及为何它能成为生产环境的首选遍历方案。1. Redis字典结构与遍历挑战Redis的键空间存储在一个全局字典中其底层实现采用经典的数组链表结构。这个字典的初始大小为4个槽位slot随着键值对的增加会自动扩容每次扩容将槽位数量翻倍4→8→16→32...。这种设计带来两个关键特性哈希冲突处理当不同键的哈希值映射到同一槽位时会形成链表结构快速定位通过哈希值与掩码mask的位运算直接定位槽位// Redis字典结构的简化表示 typedef struct dict { dictEntry **table; // 二维指针数组 unsigned long size; // 总槽位数2^n unsigned long sizemask; // 掩码size-1 unsigned long used; // 已使用槽位数 } dict;传统遍历方式面临的核心问题是在遍历过程中发生扩容/缩容会导致元素位置变化。假设我们正遍历一个8槽位的字典原始槽位存储元素示例扩容后位置16槽位0 (000)keyA, keyB0 (0000), 8 (1000)3 (011)keyC, keyD, keyE3 (0011), 11 (1011)5 (101)keyF5 (0101), 13 (1101)这种位置变化可能导致两个严重问题重复遍历扩容后部分元素会移动到新槽位可能被重复扫描遗漏风险缩容时多个槽位元素合并可能跳过某些未检查的元素2. 高位进位加法SCAN的遍历智慧SCAN命令采用高位进位加法Reverse Binary Iteration算法这是一种与常规二进制计数方向相反的遍历顺序。其核心优势在于无论字典如何扩容缩容都能保证元素不被重复或遗漏。2.1 常规遍历 vs 高位进位遍历以4槽位字典为例观察两种遍历顺序差异# 常规顺序高位进位顺序 000 (0) 000 (0) 001 (1) 100 (4) 010 (2) 010 (2) 011 (3) 110 (6) 100 (4) 001 (1) 101 (5) 101 (5) 110 (6) 011 (3) 111 (7) 111 (7)高位进位加法的数学本质是每次迭代都在二进制表示的左侧加1进位向右传递。这种顺序具有以下关键特性扩容友好新槽位原槽位高位0/1保证扩容后遍历连续性缩容兼容去掉最高位后仍保持遍历进度2.2 扩容场景下的遍历保证假设当前字典从8槽位扩容到16槽位SCAN的遍历过程如下已遍历槽位000(0)→100(4)→010(2)→110(6)当前游标指向001(1)扩容后原001(1)的元素会分散到0001(1)和1001(9)根据高位进位顺序下一个遍历的将是0001(1)关键观察扩容后需要检查的新槽位1001其数值大于当前游标0001因此不会重复扫描已检查过的区域3. 渐进式rehash与SCAN实现Redis采用渐进式rehash策略来平滑处理字典扩容这会导致同时存在两个哈希表ht[0]和ht[1]。SCAN命令需要特殊处理这种状态def scan(dict, cursor): # 检查是否处于rehash状态 if dict.is_rehashing(): # 先扫描小表中的槽位 scan_small_table() # 再扫描大表中对应范围的槽位 scan_large_table() else: scan_normal_table() # 应用高位进位算法计算新游标 new_cursor reverse_binary_increment(cursor) return new_cursor, results实际处理中的几个关键细节双表扫描需要同时检查新旧两个哈希表游标转换根据rehash进度调整游标映射关系重复过滤客户端需要处理可能的重复结果4. 生产环境中的最佳实践虽然SCAN解决了KEYS的阻塞问题但使用时仍需注意以下要点4.1 COUNT参数调优COUNT参数只是建议值实际返回数量可能波动。建议测试不同COUNT值的效果COUNT值平均返回键数网络往返次数CPU负载10085-120较高低1000800-1500中等中50003000-6000低高4.2 客户端处理模式推荐以下客户端实现模式// Java示例基于Jedis的SCAN封装 public SetString safeScan(Jedis jedis, String pattern) { SetString keys new HashSet(); String cursor ScanParams.SCAN_POINTER_START; ScanParams params new ScanParams().match(pattern).count(500); do { ScanResultString result jedis.scan(cursor, params); keys.addAll(result.getResult()); cursor result.getCursor(); } while (!cursor.equals(ScanParams.SCAN_POINTER_START)); return keys; }4.3 特殊场景处理集群环境需要对每个节点单独执行SCAN大键扫描结合TYPE命令识别大对象模式优化prefix*比*suffix模式效率更高在百万级键值对的生产环境中合理使用SCAN可以将遍历操作对服务的影响控制在2%以下的性能波动而KEYS命令可能导致秒级阻塞。这也是为什么所有Redis生产规范都强制要求使用SCAN替代KEYS。

GPT BAT：突破GPT上下文限制，实现长文本智能分段与批量处理

1. 项目概述：当长文本遇上GPT的“短记忆”如果你和我一样，经常需要处理大段的文本——比如整理一份冗长的会议纪要、分析一篇万字行业报告，或者批量润色几十篇产品描述——那你肯定对ChatGPT的聊天窗口限制深有体会。无论是GPT-3.5还是GPT-4&…...

2026/5/14 12:08:26 阅读更多 →

高效提取Live2D模型：Unity资源导出的完整实战指南

高效提取Live2D模型：Unity资源导出的完整实战指南【免费下载链接】UnityLive2DExtractor Unity Live2D Cubism 3 Extractor 项目地址: https://gitcode.com/gh_mirrors/un/UnityLive2DExtractor UnityLive2DExtractor是一款专为Unity开发者设计的智能工具&a…...

2026/5/14 12:07:25 阅读更多 →

跨栈AES加解密实战：打通CryptoJS前端与Java后端的密钥与数据流

1. 为什么需要跨栈AES加解密？ 在Web应用开发中，数据安全传输是个绕不开的话题。想象一下，用户在登录页面输入密码时，如果直接明文传输，就像把银行卡密码写在明信片上邮寄一样危险。我去年负责一个金融项目时就遇到过这…...

2026/5/14 12:04:04 阅读更多 →

CANN/ops-transformer FlashAttention V2

aclnnFlashAttentionScoreV2 【免费下载链接】ops-transformer 本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-transformer 产品支持情况产品是否支持Ascend 950PR/Ascend 950DTAtlas A…...

2026/5/13 8:58:04 阅读更多 →