别再死记硬背了！用Python一步步模拟计算机的除法：从‘不恢复余数法’到‘基2-SRT法’

张

张建站

2026/5/27 4:02:07

10分钟阅读

别再死记硬背了！用Python一步步模拟计算机的除法：从‘不恢复余数法’到‘基2-SRT法’

用Python动态模拟计算机除法从不恢复余数法到基2-SRT算法计算机如何执行除法运算这个看似简单的问题背后隐藏着精妙的算法设计。本文将带你用Python代码完整实现两种经典除法算法——不恢复余数法和基2-SRT算法通过可视化每一步的寄存器状态变化深入理解计算机执行除法的底层原理。1. 计算机除法算法基础在计算机体系结构中除法是最复杂的算术运算之一。与人类使用的长除法不同计算机采用基于移位和减法的迭代算法来实现除法运算。这些算法的核心思想都是通过一系列移位-比较-选择的循环操作来逐步确定商的每一位。1.1 二进制除法的特殊性二进制除法相比十进制更为简单因为每一位商只能是0或1。这简化了判断过程但算法设计需要考虑更多细节# 二进制除法基本框架 def binary_division(dividend, divisor, algorithm): # 初始化寄存器 remainder dividend quotient 0 bits len(bin(dividend)) - 2 # 获取位数 for i in range(bits): # 左移操作 remainder 1 # 根据算法选择商位 if algorithm non_restoring: q_bit non_restoring_select(remainder, divisor) elif algorithm srt: q_bit srt_select(remainder, divisor) # 更新余数 remainder update_remainder(remainder, divisor, q_bit) # 设置商位 quotient (quotient 1) | q_bit return quotient, remainder注意实际实现中需要考虑符号位处理、数值范围限制等更多细节这里展示的是简化后的核心逻辑。1.2 算法性能关键指标评估除法算法性能时主要考虑三个维度指标描述影响因素延迟完成一次除法所需时间迭代次数/每步复杂度面积硬件实现占用的芯片面积电路复杂度功耗运算消耗的能量操作步骤/电路切换频率现代处理器通常采用SRT等高级算法在延迟和面积之间取得平衡。接下来我们将深入两种具体实现。2. 不恢复余数法实现与可视化不恢复余数法(Non-Restoring Division)是对恢复余数法的改进通过消除恢复步骤来提高运算速度。其核心思想是当余数为负时不立即恢复为正数而是在下一步操作中补偿。2.1 算法步骤详解预处理确保被除数小于除数否则需要调整初始化设置余数寄存器R被除数商Q0迭代过程将R左移1位根据R的符号位决定加减操作设置对应商位后处理根据需要修正最终余数def non_restoring_divide(dividend, divisor, bits8): # 转换为补码表示 def to_twos_complement(x, bits): return x if x 0 else (1 bits) x # 从补码还原 def from_twos_complement(x, bits): return x if x (1 (bits-1)) else x - (1 bits) # 确保被除数小于除数 if abs(dividend) abs(divisor): raise ValueError(Dividend must be smaller than divisor) R to_twos_complement(dividend, bits*2) D to_twos_complement(divisor, bits*2) Q 0 print(f初始状态: R{bin(R)}, Q{bin(Q)}) for i in range(bits): # 左移R和Q R 1 Q 1 # 判断操作类型 if R 0: R - D q_bit 1 else: R D q_bit 0 # 设置商位 Q | q_bit print(f第{i1}步: R{bin(R ((1 (bits*2))-1))}, Q{bin(Q)}) # 处理可能的负余数 if R 0: R D Q - 1 return from_twos_complement(Q, bits), from_twos_complement(R, bits*2)2.2 实例演示与调试让我们以5/3为例5/16 ÷ 3/4即5/12观察每一步的状态变化 Q, R non_restoring_divide(5, 12, bits4) 初始状态: R0b101, Q0b0 第1步: R0b1010, Q0b0 第2步: R0b1001, Q0b1 第3步: R0b110, Q0b10 第4步: R0b1100, Q0b100通过打印的调试信息可以清晰看到余数寄存器R的逐步变化商Q的逐位构建过程关键决策点的判断逻辑3. 基2-SRT算法深度解析SRT算法以三位发明者(Sweeney, Robertson, Tocher)命名是高性能处理器常用的除法实现方式。基2-SRT是其中最简单的一种允许商位选择-1,0,1通过冗余表示提高运算速度。3.1 算法核心改进相比不恢复余数法SRT算法有两大关键创新冗余商集允许商位为{-1,0,1}减少迭代次数查找表驱动基于余数高位部分决定操作无需完全比较def srt_divide(dividend, divisor, bits8): # 预处理确保除数在[0.5,1)范围内 normalized_divisor divisor shift 0 while normalized_divisor 0.5: normalized_divisor * 2 shift 1 while normalized_divisor 1: normalized_divisor / 2 shift - 1 # 初始化变量 R dividend / (1 shift) D normalized_divisor Q 0 Q_rep [] # 使用列表记录冗余商 print(f归一化后: D{D}, 初始R{R}) for i in range(bits): # 确定商位选择 if R 0.5: q 1 elif R -0.5: q 0 else: q -1 # 更新余数 R 2 * R - q * D # 记录商位 Q_rep.append(q) print(f第{i1}步: q{q}, R{R}) # 将冗余商转换为二进制 Q 0 for q in Q_rep: Q (Q 1) | (1 if q 1 else 0) return Q, R * (1 shift)3.2 商位选择规则SRT算法的核心在于商位选择函数通常基于余数高几位进行判断余数范围商位选择[0.5, ∞)1[-0.5, 0.5)0(-∞, -0.5)-1这种部分比较大幅减少了关键路径延迟是SRT算法高性能的关键。4. 两种算法对比与实践建议4.1 性能特征对比通过实际代码实现我们可以总结出两种算法的主要差异特性不恢复余数法基2-SRT算法商集{0,1}{-1,0,1}预处理XDXD, D∈[0.5,1)迭代次数n位商需n次n位商需n次关键路径全字长比较部分比较硬件复杂度较低较高(需查找表)适用场景嵌入式系统高性能CPU4.2 调试与优化技巧在实际实现这两种算法时有几个常见陷阱需要注意数值范围处理确保使用足够位宽的寄存器正确处理符号扩展边界条件测试test_cases [ (0.5, 1.0), # 简单情况 (0.1, 0.9), # 小被除数 (0.999, 1.0), # 接近上限 (-0.3, 0.8) # 带负数 ]可视化调试打印每一步的寄存器状态绘制余数变化曲线对比理论值与实际输出import matplotlib.pyplot as plt def plot_remainder(remainder_history): plt.plot(remainder_history, markero) plt.xlabel(Iteration) plt.ylabel(Remainder Value) plt.title(Remainder Change During Division) plt.grid(True) plt.show()4.3 现代处理器中的实际应用虽然我们实现了简化版本的算法但实际CPU中的除法单元要复杂得多采用基4或更高基数的SRT变种结合预测和并行技术专用硬件电路优化例如Intel的Goldmont微架构使用基16-SRT算法每周期可产生4位商。理解这些基础算法是分析现代处理器性能的基础。

Meta-Llama-3-8B-Instruct-SFT社区贡献指南：从使用到参与开发的完整教程

Meta-Llama-3-8B-Instruct-SFT社区贡献指南：从使用到参与开发的完整教程【免费下载链接】Meta-Llama-3-8B-Instruct-SFT 项目地址: https://ai.gitcode.com/hf_mirrors/Rose/Meta-Llama-3-8B-Instruct-SFT 欢迎来到Meta-Llama-3-8B-Instruct-SFT社区&#…...

2026/5/27 4:01:11 阅读更多 →

别再只会用php://filter了！深入理解PHP文件包含的三种利用姿势：伪协议、远程包含与日志注入

深入探索PHP文件包含漏洞的三大高阶利用技术在Web安全领域，文件包含漏洞一直是渗透测试和CTF比赛中的经典题型。许多初学者通过简单的php://filter伪协议就能解决基础题目，但面对更复杂的实战环境时，这种单一技巧往往捉襟见肘。本文将系统剖析…...

2026/5/27 3:57:58 阅读更多 →

从TensorFlow到PyTorch：CICC/gtr-t5-large模型转换的完整技术指南

从TensorFlow到PyTorch：CICC/gtr-t5-large模型转换的完整技术指南【免费下载链接】gtr-t5-large 项目地址: https://ai.gitcode.com/hf_mirrors/CICC/gtr-t5-large 在深度学习领域，模型框架转换是一个常见但技术性很强的任务。今天我们将深入解…...

2026/5/27 3:56:04 阅读更多 →