标量量化（Scalar Quantization, SQ）压缩算法

张

张建站

2026/4/30 12:11:26

10分钟阅读

标量量化Scalar Quantization, SQ压缩算法概述标量量化Scalar Quantization, SQ是一种基础的量化技术它将连续的浮点数值映射到离散的有限集合中。与二进制量化不同标量量化保留了更多的数值信息通过调整量化位数可以在精度和压缩率之间取得平衡。这种方法广泛应用于深度学习模型压缩、信号处理和数据分析等领域。基本原理量化过程标量量化的核心是将连续的数值范围划分为有限个离散区间每个区间用一个代表值通常是区间的中点表示Q(x)Δ⋅⌊x−min⁡Δ12⌋min⁡ Q(x) \Delta \cdot \left\lfloor \frac{x - \min}{\Delta} \frac{1}{2} \right\rfloor \minQ(x)Δ⋅⌊Δx−min21⌋min其中xxx是原始浮点值min⁡\minmin和max⁡\maxmax是数值范围的最小值和最大值Δmax⁡−min⁡2b−1\Delta \frac{\max - \min}{2^b - 1}Δ2b−1max−min是量化步长bbb是量化位数量化函数标量量化可以使用不同的量化函数均匀量化Q(x)round(x−min⁡Δ)⋅Δmin⁡ Q(x) \text{round}\left(\frac{x - \min}{\Delta}\right) \cdot \Delta \minQ(x)round(Δx−min)⋅Δmin非均匀量化对数量化Q(x)round(log⁡(x)−log⁡(min⁡)log⁡(max⁡)−log⁡(min⁡)⋅(2b−1)) Q(x) \text{round}\left(\frac{\log(x) - \log(\min)}{\log(\max) - \log(\min)} \cdot (2^b - 1)\right)Q(x)round(log(max)−log(min)log(x)−log(min)⋅(2b−1))数学基础量化误差标量量化的误差通常用均方误差MSE来衡量MSE1N∑i1N(xi−Q(xi))2 \text{MSE} \frac{1}{N} \sum_{i1}^{N} (x_i - Q(x_i))^2MSEN1i1∑N(xi−Q(xi))2信号量化噪声比SQNR量化质量可以用信号量化噪声比来评估SQNR10log⁡10(Signal PowerQuantization Noise Power) \text{SQNR} 10 \log_{10}\left(\frac{\text{Signal Power}}{\text{Quantization Noise Power}}\right)SQNR10log10(Quantization Noise PowerSignal Power)对于均匀量化理论 SQNR 为SQNRuniform6.02b1.76 dB \text{SQNR}_{\text{uniform}} 6.02b 1.76 \text{ dB}SQNRuniform6.02b1.76dB其中bbb是量化位数。算法实现基本步骤确定数值范围计算输入数据的最小值和最大值计算量化步长根据位数确定步长Δ\DeltaΔ量化映射将每个数值映射到最近的量化级别反量化根据需要将量化值恢复为近似值Python 实现示例importnumpyasnpdefscalar_quantization(data,bits8): 标量量化函数参数: data: 输入数据数组 bits: 量化位数默认为8位返回: 量化后的数据和量化参数 data_minnp.min(data)data_maxnp.max(data)# 计算量化步长delta(data_max-data_min)/(2**bits-1)# 量化quantizednp.round((data-data_min)/delta)*deltadata_min# 确保量化值在范围内quantizednp.clip(quantized,data_min,data_max)returnquantized,{min:data_min,max:data_max,delta:delta,bits:bits}defdequantize(quantized_data,params): 反量化函数参数: quantized_data: 量化后的数据 params: 量化参数返回: 反量化后的数据 returnquantized_datadefcalculate_mse(original,quantized): 计算均方误差参数: original: 原始数据 quantized: 量化数据返回: 均方误差 returnnp.mean((original-quantized)**2)defcalculate_sqnr(original,quantized): 计算信号量化噪声比参数: original: 原始数据 quantized: 量化数据返回: SQNR值分贝 signal_powernp.mean(original**2)noise_powernp.mean((original-quantized)**2)ifnoise_power0:returnfloat(inf)return10*np.log10(signal_power/noise_power)量化策略均匀量化均匀量化是最简单的量化方法量化间隔在整个数值范围内保持恒定。defuniform_quantization(data,bits8): 均匀量化实现 data_min,data_maxnp.min(data),np.max(data)delta(data_max-data_min)/(2**bits-1)# 量化quantizednp.round((data-data_min)/delta)*deltadata_min quantizednp.clip(quantized,data_min,data_max)returnquantized,delta非均匀量化非均匀量化根据数据分布调整量化间隔在数值变化剧烈的区域使用更精细的量化。defnonuniform_quantization(data,bits8): 非均匀量化对数量化实现 # 确保数据为正数data_minnp.min(data[data0])data_maxnp.max(data)# 对数量化log_minnp.log(data_min)log_maxnp.log(data_max)delta_log(log_max-log_min)/(2**bits-1)# 量化log_datanp.log(data)quantized_lognp.round((log_data-log_min)/delta_log)*delta_loglog_min quantizednp.exp(quantized_log)returnquantized,delta_log自适应量化根据数据的局部统计特性动态调整量化参数defadaptive_quantization(data,bits8,window_size1024): 自适应量化实现 quantizednp.zeros_like(data)params_list[]foriinrange(0,len(data),window_size):windowdata[i:iwindow_size]# 对每个窗口进行量化window_quantized,paramsscalar_quantization(window,bits)quantized[i:iwindow_size]window_quantized params_list.append(params)returnquantized,params_list性能分析存储效率原始浮点数32 位4 字节8 位量化8 位1 字节压缩比 4:14 位量化4 位0.5 字节压缩比 8:1压缩率(32/b):1(32/b):1(32/b):1其中bbb是量化位数精度分析量化位数均匀量化 SQNR (dB)近似精度损失849.920.39%743.900.78%637.881.56%531.863.12%425.846.25%优化技术死区量化减少量化噪声的优化技术defdeadzone_quantization(data,bits8,deadzone_factor0.5): 死区量化实现 data_min,data_maxnp.min(data),np.max(data)delta(data_max-data_min)/(2**bits-1)# 死区范围deadzonedelta*deadzone_factor# 量化normalized(data-data_min)/delta deadzone_masknp.abs(normalized-np.round(normalized))deadzone/delta# 在死区内四舍五入到零quantizednp.where(deadzone_mask,np.round(normalized)*deltadata_min,np.round(normalized)*deltadata_min)quantizednp.clip(quantized,data_min,data_max)returnquantized压缩感知量化结合压缩感知理论的量化方法defcompressive_sensing_quantization(data,bits8,sparsity_factor0.1): 压缩感知量化实现 # 计算稀疏变换这里使用简单的阈值thresholdnp.percentile(np.abs(data),100*(1-sparsity_factor))sparse_masknp.abs(data)threshold# 对稀疏部分进行精细量化data_min_sparsenp.min(data[sparse_mask])data_max_sparsenp.max(data[sparse_mask])delta_sparse(data_max_sparse-data_min_sparse)/(2**bits-1)quantizednp.zeros_like(data)# 稀疏部分精细量化quantized[sparse_mask]np.round((data[sparse_mask]-data_min_sparse)/delta_sparse)*delta_sparsedata_min_sparse# 非稀疏部分粗略量化non_sparse_mask~sparse_maskifnp.any(non_sparse_mask):data_min_non_sparsenp.min(data[non_sparse_mask])data_max_non_sparsenp.max(data[non_sparse_mask])delta_non_sparse(data_max_non_sparse-data_min_non_sparse)/(2**bits-1)quantized[non_sparse_mask]np.round((data[non_sparse_mask]-data_min_non_sparse)/delta_non_sparse)*delta_non_sparsedata_min_non_sparsereturnquantized应用场景深度学习模型压缩defquantize_neural_network_weights(model,bits8): 神经网络权重量化 quantized_model{}forname,paraminmodel.items():ifweightinnameorbiasinname:# 量化参数quantized_param,paramsscalar_quantization(param.flatten(),bits)quantized_paramquantized_param.reshape(param.shape)quantized_model[name]quantized_param quantized_model[f{name}_params]paramselse:quantized_model[name]paramreturnquantized_model图像处理defquantize_image(image,bits8): 图像量化处理 # 将图像归一化到 [0, 1]normalized_imageimage.astype(np.float32)/255.0# 量化quantized,paramsscalar_quantization(normalized_image,bits)# 恢复到 [0, 255]quantized_image(quantized*255).astype(np.uint8)returnquantized_image,params音频处理defquantize_audio(audio_signal,bits16): 音频信号量化 # 量化音频信号quantized_audio,paramsscalar_quantization(audio_signal,bits)returnquantized_audio,params实际应用案例TensorFlow 模型量化importtensorflowastfdeftensorflow_quantization(model,bits8): TensorFlow 模型量化示例 # 转换为 TensorFlow Lite 格式并量化convertertf.lite.TFLiteConverter.from_keras_model(model)# 设置量化参数converter.optimizations[tf.lite.Optimize.DEFAULT]converter.target_spec.supported_types[tf.float16]# 转换quantized_modelconverter.convert()returnquantized_modelPyTorch 模型量化importtorchimporttorch.quantizationdefpytorch_quantization(model,bits8): PyTorch 模型量化示例 # 设置量化配置model.qconfigtorch.quantization.get_default_qconfig(fbgemm)# 融合和量化模型model_preparedtorch.quantization.prepare(model)model_quantizedtorch.quantization.convert(model_prepared)returnmodel_quantized性能优化技巧向量化量化defvectorized_quantization(data,bits8): 向量化量化实现 data_minnp.min(data,axis-1,keepdimsTrue)data_maxnp.max(data,axis-1,keepdimsTrue)delta(data_max-data_min)/(2**bits-1)# 向量化量化quantizednp.round((data-data_min)/delta)*deltadata_min quantizednp.clip(quantized,data_min,data_max)returnquantized并行量化fromconcurrent.futuresimportThreadPoolExecutordefparallel_quantization(data,bits8,num_workers4): 并行量化实现 chunk_sizelen(data)//num_workers chunks[data[i:ichunk_size]foriinrange(0,len(data),chunk_size)]withThreadPoolExecutor(max_workersnum_workers)asexecutor:resultslist(executor.map(lambdax:scalar_quantization(x,bits),chunks))quantized_chunks[result[0]forresultinresults]quantizednp.concatenate(quantized_chunks)returnquantized总结标量量化是一种简单而有效的量化技术通过将连续数值映射到离散集合实现了存储空间的大幅减少。通过调整量化位数可以在精度和压缩率之间灵活平衡。标量量化在深度学习模型压缩、信号处理和图像处理等领域有着广泛的应用。

告别旧版Eclipse！2022版保姆级中文包安装指南，附赠多语言切换小技巧

2022版Eclipse终极本地化指南：从中文包安装到多语言无缝切换如果你还在用五年前的Eclipse Neon版本，现在可能是时候拥抱2022版了。新版本不仅修复了大量插件兼容性问题，更重要的是带来了更流畅的多语言支持体验。作为一款历经20年迭代的IDE&…...

2026/4/30 12:05:42 阅读更多 →

别再只会用t检验了！用MATLAB手把手教你做置换检验（附完整代码与脑电信号实战）

置换检验实战指南：用MATLAB破解小样本与非正态分布难题在神经科学研究中，我们常常遇到这样的困境：精心设计的脑电实验只收集到少量被试数据，或者数据分布明显偏离正态假设。这时，传统t检验可能给出误导性结论。我曾分…...

2026/4/30 12:05:40 阅读更多 →

MATLAB小提琴图完整指南：从入门到精通的数据可视化利器

MATLAB小提琴图完整指南：从入门到精通的数据可视化利器【免费下载链接】Violinplot-Matlab Violin Plots for Matlab 项目地址: https://gitcode.com/gh_mirrors/vi/Violinplot-Matlab 你是否曾经面对复杂的统计数据集感到困惑？传统的箱线图虽然…...

2026/4/30 12:05:37 阅读更多 →