吴恩达《深度学习》第一课笔记：我用Python和NumPy手搓了一个神经网络

张

张建站

2026/4/25 15:48:27

10分钟阅读

用Python和NumPy从零实现神经网络吴恩达深度学习课实践指南在咖啡厅里盯着吴恩达教授的《深度学习》课程视频我反复拖动进度条试图理解那些矩阵运算的含义。直到有一天我决定关掉视频打开Jupyter笔记本用最基础的Python和NumPy库亲手实现一个神经网络——这个决定让我真正理解了反向传播的优雅和向量化的威力。1. 环境准备与基础概念工欲善其事必先利其器。我们需要准备最精简的工具链import numpy as np import matplotlib.pyplot as plt神经网络的核心在于用数学函数模拟生物神经元。一个最简单的神经网络单元可以表示为输出激活函数(权重·输入偏置)这个公式看似简单却蕴含着几个关键概念权重(Weights): 决定每个输入特征的重要性偏置(Bias): 调整神经元的激活阈值激活函数: 引入非线性常用Sigmoid、ReLU等初学者常犯的错误是直接使用线性函数作为激活——这会导致网络退化为线性回归失去深度的意义。2. 实现逻辑回归模型逻辑回归实际上是单层神经网络非常适合作为入门案例。我们需要实现三个核心组件2.1 Sigmoid激活函数def sigmoid(z): return 1 / (1 np.exp(-z))这个函数的输出范围是(0,1)非常适合二分类问题。它的导数有个优雅的性质def sigmoid_derivative(z): return sigmoid(z) * (1 - sigmoid(z))2.2 前向传播前向传播就是数据通过网络流动的过程def forward_prop(X, W, b): Z np.dot(W.T, X) b # 线性部分 A sigmoid(Z) # 激活部分 return A2.3 损失函数与梯度计算二元交叉熵损失函数衡量预测与真实的差距def compute_cost(A, Y): m Y.shape[1] cost -np.mean(Y * np.log(A) (1-Y) * np.log(1-A)) return cost反向传播计算梯度时初学者常困惑于矩阵维度。记住这个黄金法则dW (1/m) * X · (A-Y).T db (1/m) * np.sum(A-Y)3. 构建单隐层神经网络现在升级到真正的神经网络——包含一个隐藏层。这需要管理两组参数(W1,b1)和(W2,b2)。3.1 参数初始化随机初始化打破对称性很重要def initialize_parameters(n_x, n_h, n_y): W1 np.random.randn(n_h, n_x) * 0.01 b1 np.zeros((n_h, 1)) W2 np.random.randn(n_y, n_h) * 0.01 b2 np.zeros((n_y, 1)) return {W1: W1, b1: b1, W2: W2, b2: b2}3.2 完整的前向传播def forward_propagation(X, parameters): W1, b1, W2, b2 parameters[W1], parameters[b1], parameters[W2], parameters[b2] Z1 np.dot(W1, X) b1 A1 np.tanh(Z1) # 隐藏层使用tanh激活 Z2 np.dot(W2, A1) b2 A2 sigmoid(Z2) # 输出层仍用sigmoid cache {Z1: Z1, A1: A1, Z2: Z2, A2: A2} return A2, cache3.3 反向传播的实现这是最考验理解的部分需要计算四个梯度def backward_propagation(parameters, cache, X, Y): m X.shape[1] W2 parameters[W2] A1 cache[A1] A2 cache[A2] dZ2 A2 - Y dW2 (1/m) * np.dot(dZ2, A1.T) db2 (1/m) * np.sum(dZ2, axis1, keepdimsTrue) dZ1 np.dot(W2.T, dZ2) * (1 - np.power(A1, 2)) # tanh的导数是1-A^2 dW1 (1/m) * np.dot(dZ1, X.T) db1 (1/m) * np.sum(dZ1, axis1, keepdimsTrue) return {dW1: dW1, db1: db1, dW2: dW2, db2: db2}4. 训练过程与可视化4.1 参数更新def update_parameters(parameters, grads, learning_rate): W1 parameters[W1] - learning_rate * grads[dW1] b1 parameters[b1] - learning_rate * grads[db1] W2 parameters[W2] - learning_rate * grads[dW2] b2 parameters[b2] - learning_rate * grads[db2] return {W1: W1, b1: b1, W2: W2, b2: b2}4.2 训练循环完整的训练过程需要迭代以下步骤初始化参数前向传播计算预测值计算损失函数反向传播计算梯度更新参数重复直到收敛def train(X, Y, n_h, learning_rate0.01, num_iterations10000): n_x X.shape[0] n_y Y.shape[0] parameters initialize_parameters(n_x, n_h, n_y) costs [] for i in range(num_iterations): A2, cache forward_propagation(X, parameters) cost compute_cost(A2, Y) grads backward_propagation(parameters, cache, X, Y) parameters update_parameters(parameters, grads, learning_rate) if i % 1000 0: costs.append(cost) print(f迭代次数 {i}: 损失值 {cost}) return parameters, costs4.3 结果可视化训练完成后我们可以绘制学习曲线plt.plot(costs) plt.ylabel(损失值) plt.xlabel(迭代次数(每1000次)) plt.title(f学习率 {learning_rate}) plt.show()以及决策边界def plot_decision_boundary(X, Y, parameters): # 创建网格点 x_min, x_max X[0, :].min() - 1, X[0, :].max() 1 y_min, y_max X[1, :].min() - 1, X[1, :].max() 1 h 0.01 xx, yy np.meshgrid(np.arange(x_min, x_max, h), np.arange(y_min, y_max, h)) # 预测每个网格点 Z, _ forward_propagation(np.c_[xx.ravel(), yy.ravel()].T, parameters) Z Z.reshape(xx.shape) # 绘制等高线和散点 plt.contourf(xx, yy, Z, alpha0.8) plt.scatter(X[0, :], X[1, :], cY.ravel(), edgecolorsk) plt.show()5. 实战技巧与常见问题5.1 调试技巧当网络不收敛时可以尝试梯度检查比较解析梯度与数值梯度学习率测试尝试不同的学习率(0.001, 0.01, 0.1等)小数据集测试先在少量数据上过拟合确保代码正确5.2 性能优化向量化避免Python循环使用NumPy矩阵运算内存管理及时删除大中间变量提前停止当验证集误差开始上升时停止训练5.3 扩展思路掌握了基础实现后可以尝试添加更多隐藏层实现深度网络实现不同的激活函数(ReLU, LeakyReLU等)加入正则化技术(L2, Dropout)实现更高级的优化器(Adam, RMSprop)第一次看到自己手写的神经网络在简单的分类任务上达到90%准确率时那种成就感是看十遍理论推导也无法替代的。建议读者在理解本文代码后尝试用不同的数据集测试比如经典的鸢尾花数据集或MNIST数字识别——这才是真正掌握神经网络的开始。

告别龟速下载！RedHat 9/CentOS Stream 9 一键切换阿里云、清华等国内Yum源（2024最新）

2024年RedHat 9/CentOS Stream 9国内Yum源极速配置指南刚装完RedHat 9系统，看着进度条像蜗牛爬一样慢？别急，这份指南能让你在5分钟内把下载速度提升10倍。作为常年折腾Linux的老鸟，我总结了一套最省时省力的国内源切换方案&#…...

2026/4/25 15:45:42 阅读更多 →

openclaw onboard --install-daemon Error: Cannot find module ‘./internal/tslib.js‘

这说明 OpenClaw 的依赖包（特别是 anthropic-ai 相关的包）内部结构损坏或版本不兼容。这种情况通常是因为 npm 在深层嵌套的依赖安装时失败了。请尝试以下彻底清理的步骤： 第一步：彻底删除残留文件（关键步骤&#xff…...

2026/4/25 15:45:11 阅读更多 →

服务器搭建1

...

2026/4/25 15:41:36 阅读更多 →

背靠背VSC直流母线电压控制与同步发电机并网发散问题：原理、分析与解决方案

背靠背VSC直流母线电压控制与同步发电机并网发散问题：原理、分析与解决方案摘要背靠背电压源换流器（Back-to-Back VSC）是现代柔性直流输电和新能源并网系统的核心设备。在实际工程调试中，经常出现一个令人困扰的现象：当采用“三相电源-VSC-直流母线-VSC-三相电源”的背…...

2026/4/25 4:58:40 阅读更多 →

5分钟搞定抖音素材批量下载：douyin-downloader让你的创作效率翻倍

5分钟搞定抖音素材批量下载：douyin-downloader让你的创作效率翻倍【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fal…...

2026/4/25 4:58:42 阅读更多 →