目录2.1 双分支并行网络拓扑结构2.1.1 KAN分支的深层架构设计2.1.1.1 宽度(Width)与深度(Depth)的权衡:计算复杂度分析2.1.1.2 网格大小 $G$ 与B样条阶数 $k$ 的协同配置2.1.1.3 残差连接的跨层实现与梯度高速公路构建2.1.2 MLP分支的互补配置2.1.2.1 Fourier特征嵌入(FFE)的随机与可学习频率对比2.1.2.2 激活函数选择:Tanh与SwiGLU在物理约束中的适应性2.1.2.3 LayerNorm与残差预归一化的稳定性提升2.2 可学习缩放因子机制(Learnable Scaling Mechanism)2.2.1 逐层融合权重的数学形式2.2.1.1 标量缩放(Scalar Scaling):$\alpha,\beta \in \mathbb{R}$ 的参数化2.2.1.2 向量缩放(Vector Scaling):通道级注意力权重 $\alpha \in \mathbb{R}^{d_{\text{out}}}$2.2.1.3 软门控(Soft Gating)的Sigmoid约束:$\sigma(\alpha)/(\sigma(\alpha)+\sigma(\beta))$2.2.2 物理驱动的权重初始化策略2.2.2.1 线性主导问题的MLP偏重初始化($\alpha_{\text{init}}=0.3, \beta_{\text{init}}=0.7$)2.2.2.2 高频振荡问题的KAN偏重初始化($\alpha_{\text{init}}=0.7, \beta_{\text{init}}=0.3$)2.2.2.3 对称初始化($\alpha_{\text{init}}=\beta_{\text{init}}=0.5$)与训练稳定性2.2.3 动态权重调整的训练策略2.2.3.1 基于损失曲率的自适应平衡:$\partial \alpha / \partial \mathcal{L}$ 的梯度下降更新2.2.3.2 残差驱动的权重重标定:$\alpha \propto \|R_{\text{KAN}}\|^{-1}, \beta \propto \|R_{\text{MLP}}\|^{-1}$2.3 特征融合层的实现方案2.3.1 融合策略的数学对比2.3.1.1 逐元素加权相加(Weighted Addition):$u_{\text{hybrid}} = \alpha \cdot u_{\text{KAN}} + \beta \cdot u_{\text{MLP}}$2.3.1.2 通道拼接与投影(Concatenation + Linear Projection):$[u_{\text{KAN}}; u_{\text{MLP}}] \cdot W_{\text{proj}}$2.3.1.3 门控融合(Gated Fusion):$g \odot u_{\text{KAN}} + (1-g) \odot u_{\text{MLP}}$2.3.2 跨分支特征交互(可选增强)2.3.2.1 KAN到MLP的梯度反馈机制2.3.2.2 交叉注意力(Cross-Attention)的计算开销与精度权衡第二部分 代码实现脚本1:KAN分支深层架构与复杂度分析(对应2.1.1节)脚本2:MLP分支互补配置(对应2.1.2节)脚本3:可学习缩放因子机制(对应2.2节)脚本4:特征融合层实现方案(对应2.3节)脚本5:完整HPKM-PINN系统集成(对应第2章整体架构)2.1 双分支并行网络拓扑结构HPKM-PINN 采用双分支并行拓扑,通过 KAN 分支捕捉局部非线性特征与 MLP 分支提取全局模式,实现物理方程多尺度逼近。该拓扑在输入层实施特征复制,经独立编码后通过自适应融合层输出,形成"分裂-编码-融合"的计算范式。2.1.1 KAN分支的深层架构设计KAN 分支基于 Kolmogorov-Arnold 表示定理构建,将传统 MLP 的固定激活函数替换为可学习的单变量函数,通过 B 样条基函数网络实现任意连续函数的精确逼近。该分支在物理 PINN 中承担高频振荡与陡峭梯度区域的逼近任务。