2. 梯度下降算法分类

张

张建站

2026/4/28 20:07:19

10分钟阅读

2. 梯度下降算法分类

1. 梯度下降法分类2. 几种降法下降算法特点(1️⃣ 全梯度下降算法(Full Gradient Descent)每次迭代时使用全部样本的梯度值但每次使用全部数据有弊端速度太慢、效率低2️⃣ 随机梯度下降算法SGD每次迭代时随机选择并使用一个样本梯度值无法保证这个样本的梯度值没有问题因此不稳定但是有好处当用到梯度下降算法时已经时机器学习的第四步 - 模型训练在第二三步中数据预处理、特征工程中已经将数据处理过了数据没有问题。因此为提高效率也可以使用随机梯度算法两者区别全梯度下降因为使用了所有的样本数据更精准但速度慢随机梯度下降因为随机使用一个速度快但如果这个样本是异常值则对最终结果会有影响两者过多或过少3️⃣ 小批量梯度下降算法(mini-batch)每次迭代时随机选择并使用小批量的样本梯度值从m个样本中选择x个样本进行迭代(1xm)因此m1时是随机梯度下降、xt(1xm)时是小批量梯度下降、xm时是全梯度下降4️⃣ 随机平均梯度下降算法SAG每次迭代时随机选择一个样本的梯度值和以往样本的梯度值的均值。假设选择D样本计算出的梯度是3在选择一个G样本算出的梯度是5则列表值是[3, 5]然后计算列表中的梯度值均值4假设又选择了D样本梯度是3与算出的梯度均值4一起两者再求均值(为3.5)如果选择的不是D(如7)则将选择的样本加到样本列表中([3, 5, 7])再一起求均值得到5直到算法收敛。收敛即算法何时结束两种情况达到迭代次数、达到设定阈值随机平均梯度下降算法特点是开始时算出的值不准经过大量训练到后期其精准度才会提升不如选小批量梯度下降算法因此梯度下降算法中使用最多的是小梯度下降算法5️⃣ 总结全梯度是一次用所有随机是一次一个小批量是一次一批(1tm)随即平均梯度是抽样本将梯度加到列表中算列表均值)

从零构建可控大语言模型训练框架：BumbleCore的设计、实现与实战

从零构建可控大语言模型训练框架：BumbleCore的设计、实现与实战

1. 项目概述：从零构建一个完全可控的大语言模型训练框架如果你和我一样，对大语言模型（LLM）的训练过程充满好奇，不满足于仅仅调用高级API，而是想亲手“拧紧每一个螺丝”，那么BumbleCore这个项目…...

2026/4/28 20:06:34 阅读更多 →

别再手动改Shader属性了！用Scriptable Renderer Feature为URP材质动态切换打造稳健方案

别再手动改Shader属性了！用Scriptable Renderer Feature为URP材质动态切换打造稳健方案

别再手动改Shader属性了！用Scriptable Renderer Feature为URP材质动态切换打造稳健方案在Unity开发中，动态修改材质属性是常见的需求，特别是当我们需要在运行时切换物体的透明与不透明状态时。传统做法是直接操作材质球的_Surface、_SrcBlen…...

2026/4/28 20:06:31 阅读更多 →

前列腺 MRI-病理 3D 配准：弹性形变场 + 体素重建全流程

前列腺 MRI-病理 3D 配准：弹性形变场 + 体素重建全流程

文章目录前列腺 MRI-病理 3D 配准：弹性形变场 + 体素重建全流程一、任务二、环境三、数据 3.1 结构 3.2 MRI 预处理四、模型 4.1 弹性配准网络 4.2 损失函数五、训练六、评估七、消融八、调试九、总结代码链接与详细流程购买即可解锁1000+YOLO优化文章，并且还有海…...

2026/4/28 20:06:00 阅读更多 →

Arm SVE2指令集：矩阵运算与密码学加速实战解析

Arm SVE2指令集：矩阵运算与密码学加速实战解析

1. SVE2指令集架构概述SVE2（Scalable Vector Extension 2）作为Armv9架构的核心扩展，代表了向量计算技术的重大突破。我在实际开发中发现，与传统NEON指令集相比，SVE2最显著的特点是引入了可变的向量长度（128…...

2026/4/28 11:27:44 阅读更多 →

Agent-C：4KB纯C语言AI智能体，零依赖实现本地Shell命令执行

Agent-C：4KB纯C语言AI智能体，零依赖实现本地Shell命令执行

1. 项目概述：一个极简主义的AI执行者最近在折腾AI应用本地化部署时，我一直在寻找一个能真正“轻装上阵”的解决方案。市面上的AI Agent框架动辄几百MB，依赖库一大堆，部署起来让人头疼。直到我遇到了Agent-C，一个用纯…...

2026/4/28 11:27:46 阅读更多 →

如何在响应式网页中水平居中表单（CSS 绝对定位居中方案）

如何在响应式网页中水平居中表单（CSS 绝对定位居中方案）

...

2026/4/28 11:27:49 阅读更多 →

QuantLib C++金融库VSCode调试全链路打通，从源码级断点到PnL敏感度热重载，仅需7分钟

QuantLib C++金融库VSCode调试全链路打通，从源码级断点到PnL敏感度热重载，仅需7分钟

更多请点击： https://intelliparadigm.com 第一章：QuantLib C金融库VSCode调试全链路打通，从源码级断点到PnL敏感度热重载，仅需7分钟在量化交易系统开发中，QuantLib 的 C 原生实现提供了高精度定价与风险引擎&#x…...

2026/4/28 11:27:51 阅读更多 →