在openEuler 22.03 LTS上，我这样给NVIDIA A100显卡装好了CUDA 11.6和cuDNN 8.4

张

张建站

2026/7/17 11:52:05

10分钟阅读

在openEuler 22.03 LTS上，我这样给NVIDIA A100显卡装好了CUDA 11.6和cuDNN 8.4

在openEuler 22.03 LTS上为NVIDIA A100部署CUDA 11.6与cuDNN 8.4全流程解析当高性能计算遇上国产操作系统如何在openEuler 22.03 LTS上为NVIDIA A100这样的顶级计算卡搭建完整的CUDA生态本文将带你完整走通从驱动安装到深度学习环境配置的全过程特别针对国产化环境中的特殊配置需求提供解决方案。1. 环境预检与系统准备在开始安装前我们需要对硬件和系统环境进行全面检查。执行lspci | grep -i nvidia确认显卡识别情况A100设备通常会显示为NVIDIA Corporation Device 20f1。特别注意在ARM架构的openEuler系统上所有软件包都必须选择aarch64版本。系统内核版本检查至关重要uname -r # 示例输出4.19.90-2003.4.0.0036.oe1.aarch64必须确保kernel-devel包与当前运行内核严格匹配yum list installed | grep kernel-devel # 若无输出或版本不匹配需执行 yum install kernel-devel-$(uname -r)禁用开源驱动nouveau是NVIDIA驱动安装的前提条件检查是否存在nouveau驱动lsmod | grep nouveau创建配置文件/etc/modprobe.d/blacklist-nouveau.confblacklist nouveau options nouveau modeset0更新initramfsdracut --force重启系统后验证lsmod | grep nouveau应无输出2. 驱动安装与特殊配置针对A100的Ampere架构需要特别注意驱动版本选择。经实测470.82.01版本驱动在openEuler 22.03上表现稳定。下载驱动后执行安装时需指定内核源码路径chmod x NVIDIA-Linux-aarch64-470.82.01.run ./NVIDIA-Linux-aarch64-470.82.01.run \ --kernel-source-path/usr/src/kernels/$(uname -r) \ --no-x-check \ --no-opengl-files安装过程中有几个关键选项需要注意DKMS注册选择Yes以便未来内核升级后自动重建驱动模块X-config选择No避免生成不必要的Xorg配置32位兼容库在纯64位系统中可跳过安装完成后通过nvidia-smi验证驱动状态正常应显示如下信息----------------------------------------------------------------------------- | NVIDIA-SMI 470.82.01 Driver Version: 470.82.01 CUDA Version: 11.4 | |--------------------------------------------------------------------------- | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | || | 0 NVIDIA A100-PCIE... On | 00000000:01:00.0 Off | 0 | | N/A 35C P0 45W / 250W | 0MiB / 40536MiB | 0% Default | ---------------------------------------------------------------------------3. CUDA Toolkit定制化安装CUDA 11.6的安装需要特别注意组件选择。从NVIDIA官网下载aarch64版本的runfile安装包后执行sh cuda_11.6.0_510.39.01_linux_sbsa.run安装界面中建议仅选择以下组件CUDA Toolkit 11.6CUDA Demo SuiteCUDA Documentation重要配置项安装路径保持默认/usr/local/cuda-11.6创建符号链接到/usr/local/cuda不安装驱动已单独安装更新版本环境变量配置需要添加到/etc/profile.d/cuda.shexport PATH/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH/usr/local/cuda/lib64:$LD_LIBRARY_PATH export CUDA_HOME/usr/local/cuda验证安装nvcc --version # 应显示release 11.6, V11.6.55 cd /usr/local/cuda/samples/1_Utilities/deviceQuery make ./deviceQuery # 最后应显示Result PASS4. cuDNN深度优化部署cuDNN 8.4.0需要与CUDA 11.6严格匹配。下载Linux aarch64版本的tar包后执行以下部署步骤tar -xzvf cudnn-11.4-linux-aarch64sbsa-v8.2.4.15.tgz sudo cp cuda/include/cudnn*.h /usr/local/cuda/include sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 sudo chmod ar /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*验证cuDNN安装cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2 # 应显示类似 #define CUDNN_MAJOR 8 #define CUDNN_MINOR 4 #define CUDNN_PATCHLEVEL 0为提升深度学习性能建议额外配置以下环境变量export CUDNN_HOME/usr/local/cuda export CUDNN_LIBRARY/usr/local/cuda/lib64 export CUDNN_INCLUDE_DIR/usr/local/cuda/include5. 性能调优与问题排查针对A100的特有功能需要进行额外配置以发挥最大性能GPU持久模式设置nvidia-smi -pm 1 # 启用持久模式 nvidia-smi -lgc 1000,1000 # 锁定GPU时钟频率MIG配置可选nvidia-smi mig -i 0 -cgi 19 # 创建计算实例 nvidia-smi mig -i 0 -gi 0 -cci 0 # 创建上下文实例常见问题解决方案驱动加载失败检查dmesg | grep nvidia常见原因是内核头文件不匹配CUDA不可用运行nvidia-debugdump -l收集诊断信息cuDNN报错验证LD_LIBRARY_PATH是否包含CUDA库路径最后建议安装NVIDIA的监控工具包以获得更详细的性能数据git clone https://github.com/NVIDIA/nvidia-monitor-tools cd nvidia-monitor-tools make install

饲料颗粒机设计(农业机械)(含CAD零件图,装配图,说明书

饲料颗粒机作为农业机械领域的关键设备，其核心作用是将粉状饲料转化为均匀颗粒，提升饲料利用率与动物消化效率。传统散装饲料易分层、易氧化，而颗粒形态通过高温高压成型，不仅锁住营养成分，还能减少运输损耗与储存空间…...

2026/7/17 11:58:12 阅读更多 →

拯救手工测试：我是如何用Apifox的变量和测试套件，把重复接口验证变成一键执行的

拯救手工测试：我是如何用Apifox的变量和测试套件，把重复接口验证变成一键执行的每次面对需要手动修改几十个参数、反复验证多步骤业务流的接口测试任务时，那种重复劳动的疲惫感总会涌上心头。作为一名经历过无数个加班夜的测试工程师&#x…...

2026/7/17 12:35:25 阅读更多 →

BitNet b1.58-2B-4T实战指南：WebUI离线使用与本地模型缓存策略

BitNet b1.58-2B-4T实战指南：WebUI离线使用与本地模型缓存策略 1. 项目概述 BitNet b1.58-2B-4T是一款革命性的1.58-bit量化开源大模型，采用独特的-1、0、1三值权重设计（平均1.58 bit），配合8-bit整数激活&#xff0c…...

2026/5/8 22:22:18 阅读更多 →

3步解锁音乐自由：ncmdumpGUI终极NCM文件解密转换指南

3步解锁音乐自由：ncmdumpGUI终极NCM文件解密转换指南【免费下载链接】ncmdumpGUI C#版本网易云音乐ncm文件格式转换，Windows图形界面版本项目地址: https://gitcode.com/gh_mirrors/nc/ncmdumpGUI 你是否曾在网易云音乐下载了心爱的歌曲&#…...

2026/7/16 18:01:48 阅读更多 →

Play Integrity Fix终极指南：解决Android设备验证失败的完整方案

Play Integrity Fix终极指南：解决Android设备验证失败的完整方案【免费下载链接】PlayIntegrityFix Fix Play Integrity (and SafetyNet) verdicts. 项目地址: https://gitcode.com/GitHub_Trending/pl/PlayIntegrityFix PlayIntegrityFix是一款专为Root设备…...

2026/7/16 18:01:50 阅读更多 →

Codex CLI 接入 GPT 模型指南

Codex CLI 是一个用于与 GitHub Copilot 进行交互的命令行工具，目前并没有 GPT-5.6 这个模型。GitHub Copilot 使用的是基于 OpenAI 的 GPT 模型，但具体版本信息并未公开。如果你有其他关于 Codex CLI 或 GitHub Copilot 的问题，欢迎继续提问…...

2026/7/16 18:01:52 阅读更多 →

SingleFile：让网页永久保存的终极解决方案，告别链接失效的烦恼

SingleFile：让网页永久保存的终极解决方案，告别链接失效的烦恼【免费下载链接】SingleFile Web Extension for saving a faithful copy of a complete web page in a single HTML file 项目地址: https://gitcode.com/gh_mirrors/si/SingleFile …...

2026/7/16 18:01:54 阅读更多 →