1. SSNet在FAS信道外推中的技术突破在6G通信系统的演进过程中流体天线系统(Fluid Antenna System, FAS)因其灵活的可重构特性成为研究热点。然而FAS面临的核心挑战在于如何从有限的观测端口中准确推断完整信道状态信息(CSI)。传统深度学习方法如LSTM和AGMAE虽然取得了一定成效但存在三个显著缺陷对训练数据量需求大通常需要数十万样本、在低信噪比条件下性能急剧下降、难以适应不同尺寸的FAS配置。针对这些痛点我们团队提出了基于自监督学习的SSNet架构。与常规方案相比SSNet的创新性主要体现在三个方面首先采用对比学习与归一化均方误差(NMSE)的联合损失函数使模型在10%观测端口比例下仅需20,000个训练样本就能达到AGMAE使用800,000样本的精度其次引入混合专家(MoE)模块替代传统前馈网络(FFN)在20dB信噪比条件下将外推误差降低了4.9dB最后通过动态掩码策略增强模型鲁棒性使得同一套参数可适配从2×4cm到8×16cm的不同尺寸FAS。关键发现在5%观测端口比例下SSNet(10%)比AGMAE节省97.5%训练数据的同时NMSE指标反而提升2.3dB。这种少食多餐的训练策略颠覆了传统深度学习方法依赖大数据量的认知。2. 核心架构设计与实现细节2.1 自监督学习框架构建SSNet的核心是一个两阶段训练流程。第一阶段采用对比学习构建信道特征的通用表示给定一个CSI样本h我们通过随机掩码生成两个不同视角ĥ₁和ĥ₂掩码比例分别为10%和25%模型需要识别这两个视角来自同一原始样本。此阶段使用的对比损失函数为L_cont -log[exp(sim(z₁,z₂)/τ) / Σ exp(sim(z₁,z_k)/τ)]其中z₁,z₂是ĥ₁,ĥ₂经过编码器后的特征表示τ为温度系数实验设置为0.1时效果最佳。第二阶段引入信道外推任务其损失函数结合了NMSE和第一阶段学到的表示L α||h_pred - h_true||₂² βL_cont通过网格搜索我们发现α0.7, β0.3时在验证集上取得最优平衡。这种联合训练方式使模型在少量标注数据下就能捕捉信道空域相关性。2.2 MoE模块的革新设计传统Transformer在处理CSI数据时面临两个瓶颈固定结构的FFN难以适应不同信噪比条件下的特征分布天线端口间的复杂非线性关系需要更灵活的建模。为此我们设计了如图1所示的MoE架构输入 → MSA → 路由器 → |专家1(MLP)| |专家2(CNN)| → 加权求和 → 输出 |专家3(GCN)|路由器采用GELU激活的三层感知机实现其输出权重计算为g(x) softmax(W₂·GELU(W₁x b₁) b₂)实验中设置专家数量K4时性价比最高。在RTX 4090显卡上MoE模块仅增加0.8ms推理延迟却带来5.7dB的NMSE提升。2.3 动态掩码训练策略我们发现掩码比例对模型性能有决定性影响。如表1所示在2×4cm FAS上的实验结果揭示了一个反直觉现象训练掩码比例测试5%端口NMSE(dB)测试50%端口NMSE(dB)10%-12.3-18.725%-11.1-18.350%-8.5-17.8这种现象源于困难样本训练效应较低掩码比例迫使模型学习更本质的空域相关性。但需注意10%掩码需要31个epoch才能收敛比50%掩码多耗费138%训练时间。3. 实验验证与性能分析3.1 基准对比测试我们在三种典型场景下评估SSNet(1)小尺寸FAS(2×4cm)(2)大尺寸FAS(8×16cm)(3)完全相关信道模型。测试集包含4,000个样本信噪比覆盖-5dB到25dB。如图2所示在20dB条件下SSNet(10%)相比LSTM和AGMAE展现出显著优势5%观测端口时NMSE提升7.2dB(LSTM)/4.9dB(AGMAE)50%观测端口时优势缩小到3.1dB/1.8dB值得注意的是SSNet在0dB低信噪比时仍保持-9.5dB的NMSE而AGMAE已恶化到-5.3dB。这表明MoE模块具有天然的噪声抑制能力。3.2 跨场景泛化能力为验证模型的泛化性我们在Clarke模型训练后直接在完全相关信道模型测试零样本学习。虽然理论分析显示两种模型的空域相关性函数不同Clarke模型Σ(i,j) J₀(2πd/λ) 完全相关模型Σ(i,j) J₀(2π||p_i-p_j||/λ)但SSNet仅表现出3-5dB的性能下降远优于LSTM的8-12dB恶化。这证明自监督学习确实捕捉到了超越特定信道模型的通用特征。3.3 实时性评估表2对比了不同硬件平台上的推理时延batch_size32模型RTX 4090(ms)RTX 3060(ms)SSNet(10%)3.9014.55AGMAE2.7511.32LSTM3.0212.11虽然SSNet比AGMAE慢约40%但其卓越的精度优势在多数场景下可以接受。实际部署时可采用模型蒸馏技术将SSNet知识迁移到轻量级学生网络。4. 工程实践中的关键技巧4.1 数据预处理最佳实践相位归一化对每个CSI样本进行相位中心化处理h_normalized h * exp(-1j*angle(h[ref_port]))幅度对数压缩缓解高动态范围问题h_amp log10(|h| ε) # ε1e-6空间重采样将不规则天线端口映射到虚拟网格4.2 超参数调优指南基于100次实验的经验总结初始学习率1e-4配合余弦退火批量大小32-64小于32会导致收敛不稳定MoE专家数K4K6时出现收益递减对比损失温度τ0.05-0.2范围敏感4.3 常见故障排查现象1验证集NMSE波动大检查是否启用梯度裁剪阈值设为1.0方案增加BatchNorm层现象2低信噪比下性能骤降检查MoE路由器是否过度稀疏方案添加专家多样性损失项现象3小尺寸FAS外推失败检查空间重采样网格是否过疏方案将网格密度提高至λ/85. 未来演进方向在实际部署中发现三个待解决问题首先是实时性约束当前14ms的推理时延难以满足URLLC场景需求我们正探索知识蒸馏方案其次是动态环境适应现有静态训练策略在用户移动速度超过30km/h时性能下降明显最后是硬件损伤补偿特别是相位噪声对毫米波频段的影响。一个有趣的发现是将SSNet作为初始化模型再用特定场景数据微调仅需500样本就能达到专用模型的性能。这启示我们可能正在接近信道基础模型(Channel Foundation Model)的雏形。