每天三分钟，AI数学知识：从导数到梯度

张

张建站

2026/6/3 10:13:40

10分钟阅读

本文以科普为主旨在帮助转行Agent开发的小伙伴更好的打好AI基础提高一下知识储备不至于未来之会当一个API调包侠。AI学霸、AI算法大佬请绕行。导数是现代人工智能AI特别是深度学习Deep Learning和机器学习Machine Learning中最核心、最基础的数学工具之一。没有导数几乎所有的神经网络和高级机器学习模型都无法“学习”。我们需要先回顾一下相关的一些基础知识。基础知识点回顾正式开始之前先练习一下数学符号的发音Δ读作“德尔塔”。通常表示两个数的差值增量。∇读作“纳布拉”。通常表示梯度。∂读作“得尔”。通常用于偏导数领域。lim读作英文limit。极限的符号什么是向量在坐标系中任何一个点(x,y)都可以认为是坐标系原点指向该点的向量。什么是函数数学定义设 A 和 B 是两个非空的数集数集是指由数字组成的集合比如实数集。如果存在一个对应关系通常记为 f使得对于集合 A 中的任意一个元素 x在集合 B 中都存在唯一确定的元素 y 与之对应那么这个对应关系 f 就叫做从 A 到 B 的函数。通常记作 y f(x), x ∈ A后来大数学家笛卡尔把函数与坐标系联系起来了使得函数方程与几何图形完美的结合起来。不难发现我们计算机中的函数其思想就是来源于数学中“函数”两者如出一辙接受参数输入 arguments执行一段代码规则返回一个值输出 return value什么是斜率呢数学定义在直角坐标系中设直线函数f(x)上有两点 A(x1,y1)和 B(x2,y2)。那么这条直线的斜率通常用字母 m 表示定义为斜率可以理解成“坡有多陡”。导数的定义ok知道了什么是函数和斜率之后我们现在就来看看什么是导数数学定义晦涩难懂设函数 f(x) 在点 x0 的邻域内有定义若极限存在则称 f(x) 在 x0 处可导f’(x0) 就是 f(x) 在 x0 处的导数描绘导数的曲线f’(x)称之为导函数(有时也会写成: dy/dx)等价地也可以写成数学定义可能比较难理解实际上你可以理解为『导数就是用来描述曲线在“某一点”切线的“瞬时斜率”。』就可以了往x的方向走越来越高斜率为正往x的方向走越来越低斜率为负如果已知某个函数f(x)如何得到这个函数的导函数f’(x)呢通常在日常学习和工作中一般都是通过求导法则与基础的求导公式来高效完成的。(还记得高中背公式的场景吗)至于具体是如何推导的可以回顾一下高中知识不过不重要高中也是直接背过、然后直接使用的还记得吗导数的运算n%2F204ff107.jpgpos_idimg-w8RCbF0h-1780403204140)以下内容的公式全部都属于定理性质均属于记忆为主。实际应用过程中会直接套公式用就行了如想知道公式的推导那属于数学方向了非计算机方向可自行研究。在实际的应用中函数往往不是单一存在的通常是好多函数同时构成的复杂函数那么针对这种复杂的函数导数应该怎么求呢假设有 f(x)和g(x)两种函数一起构成的复杂函数第一种情况f(x) 和 g(x) 进行加减乘除构成的复杂函数。第二种情况f(x) 和 g(x) 组成了复合”函数f(g(x))。例如函数sin(2x) 2x - g(x)则需要链式法则yf(g(x))则 y′ f′(g(x))⋅g′(x)链式法则通俗讲就是“先对外层函数求导再乘以内层函数的导数。”在机器学习中仅有一个x变量的情况非常少通常是会有非常多非常多的变量。在这种情况下如何对某一个多维的点进行求导这就引出了导数的另外一个知识点—————偏导数梯度。偏导数梯度偏导数是多元函数微分学的基本概念用来描述函数沿某一个坐标轴方向的变化率。数学定义设函数 zf(x,y) 在点 (x0,y0)的某个邻域内有定义。固定 y y0, 给自变量x一个增量Δx使得 (x0Δx,y0)仍在该邻域内,函数相应的增量。如果极限存在则称此极限为函数 z f(x, y)在点x0,y0处对 x 的偏导数记作类似地固定 x x0给自变量y 一个增量 Δy若极限存在则称此极限为函数在点 (x0,y0) 处对y的偏导数,记作求偏导数的本质是在多元函数求导过程中求某一个函数变量的导数时把另外的几个变量暂时“冻住”当做常量来处理让其变回求一元函数的导数。数学定义可能很枯燥下面用图来表示实际中可能是非常多的维度但是人类无法理解图也没法画因为我们是三维生物就暂时以三维坐标轴为例子在三维空间下切线变成了“切面”。此时求得x的偏导数为同样的方式可以求得y的偏导数此时你会发现多元函数在某个点(x0y0,z0)的导数的值会是一组数据并非一个了分别表示各个维度的斜率(x’, y’)这一组斜率数据(x’,y’) 就叫做 “梯度”是坐标轴上的一个向量梯度代表的是函数在某一点上升最快的方向。梯度数学表达式导数这部分的很多公式和定理都是考验记忆的用的时候不必多究直接拿来用就行了就像π等于3.1415926… 可以直接拿来用一样。当然想深究可以花费一定时间去研究然而这是数学而非计算机的范畴了。学AI大模型的正确顺序千万不要搞错了2026年AI风口已来各行各业的AI渗透肉眼可见超多公司要么转型做AI相关产品要么高薪挖AI技术人才机遇直接摆在眼前有往AI方向发展或者本身有后端编程基础的朋友直接冲AI大模型应用开发转岗超合适就算暂时不打算转岗了解大模型、RAG、Prompt、Agent这些热门概念能上手做简单项目也绝对是求职加分王给大家整理了超全最新的AI大模型应用开发学习清单和资料手把手帮你快速入门学习路线:✅大模型基础认知—大模型核心原理、发展历程、主流模型GPT、文心一言等特点解析✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑✅开发基础能力—Python进阶、API接口调用、大模型开发框架LangChain等实操✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经以上6大模块看似清晰好上手实则每个部分都有扎实的核心内容需要吃透我把大模型的学习全流程已经整理好了抓住AI时代风口轻松解锁职业新可能希望大家都能把握机遇实现薪资/职业跃迁这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

别再被‘此更新不适用’坑了！手把手教你搞定KB2999226和VC++ 2015-2019安装

彻底解决KB2999226安装失败：开发者必备的Windows补丁管理指南每次打开Visual Studio准备大展身手时，那个熟悉的错误提示又跳了出来——"此更新不适用于你的计算机"。作为经历过数十次环境配置的老手，我太清楚这种挫败感了。KB29992…...

2026/6/3 10:12:38 阅读更多 →

数据洪涝时代：从数据仓库到数据网格的架构演进与组织变革

1. 项目概述：当数据不再是稀缺品“Data, Data Everywhere”，这个标题精准地捕捉了我们这个时代的核心特征。作为一名长期与数据打交道的从业者，我深刻感受到，过去十年间，我们经历了一场从“数据饥渴”到“数据洪涝”的…...

2026/6/3 10:12:18 阅读更多 →

atomic 原子操作到底有多快？我拿 Mutex 做了个对比测试

atomic 原子操作到底有多快？我拿 Mutex 做了个对比测试前言写并发代码，锁是免不了的。Mutex 好用，但确实慢。高并发场景，atomic 原子操作是个好东西，但很多人不知道怎么用对。今天我拿两百万次并发操作做了个测试&am…...

2026/6/3 10:11:36 阅读更多 →

智能水印工具终极指南：如何批量为照片添加专业相机参数水印

智能水印工具终极指南：如何批量为照片添加专业相机参数水印【免费下载链接】semi-utils 一个批量添加相机机型和拍摄参数的工具，后续「可能」添加其他功能。项目地址: https://gitcode.com/gh_mirrors/se/semi-utils 还在为数百张照片手动添加相…...

2026/6/2 10:07:16 阅读更多 →

Go语言可扩展性设计：水平扩展

Go语言可扩展性设计：水平扩展1. 引言在互联网时代，业务的快速增长对系统的扩展性提出了极高的要求。水平扩展（Scale Out）作为分布式系统的核心设计理念，能够通过增加服务器节点来提升系统的整体处理能力。与垂直扩展&…...

2026/6/3 11:01:44 阅读更多 →

Claude Code Tool System 与 Permission 机制深度解析

代码解析 Claude Code Tool System 与 Permission 机制深度解析 0. 背景与定位 Claude Code 是一个运行在终端的 Agentic 编码工具，其核心能力来自工具系统（Tool System）——AI 通过调用工具与文件系统、Shell、网络、子 Agent 交互。而**权…...

2026/6/2 10:07:56 阅读更多 →