专栏
标签
模型降阶及融合仿真工具GPU环境配置指南
技术分享
发布于 2026-04-22 09:01:53
查看 46过去41天

模型降阶及融合仿真工具 GPU 环境配置指南


一、安装前准备

1.1 安装组件清单

完成 GPU 环境配置,需要按顺序安装以下 4 个组件:

序号 组件 作用
1 NVIDIA 显卡驱动 GPU 基础驱动
2 CUDA Toolkit GPU 计算平台
3 cuDNN 深度学习加速库
4 PyTorch (GPU 版) 深度学习框架

1.2 版本选择(根据 Sysplorer 版本)

Sysplorer 版本 Python 版本 PyTorch 版本 CUDA 版本 cuDNN 版本
Sysplorer 2025 及以下 Python 3.7 PyTorch 1.12.1 CUDA 11.6 cuDNN 8.4
Sysplorer 2026 Python 3.11 PyTorch 2.4.0 CUDA 12.4 cuDNN 9.x

1.3 安装包下载清单

Python 3.11 + CUDA 12.4 方案(Sysplorer 2026):

Python 3.7 + CUDA 11.6 方案(Sysplorer 2025 及以下):


二、安装步骤

2.1 第一步:检查并更新 NVIDIA 显卡驱动

步骤 1:检查当前驱动版本

打开 PowerShell,输入:

nvidia-smi

输出示例:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 551.52       Driver Version: 551.52       CUDA Version: 12.4     |
+-------------------------------+----------------------+----------------------+

关键信息:

  • Driver Version: 551.52 → 当前驱动版本
  • CUDA Version: 12.4 → 该驱动支持的最高 CUDA 版本

步骤 2:判断是否需要更新

根据你选择的方案,检查驱动版本是否满足最低要求:

CUDA 版本 最低驱动版本
CUDA 12.4 551.61
CUDA 11.6 511.65

如果当前驱动版本 低于 上述要求,需要更新驱动。

步骤 3:更新驱动(如需要)

  1. 访问 NVIDIA 驱动下载页面:https://www.nvidia.cn/Download/index.aspx
  2. 选择你的显卡型号
  3. 下载并安装最新驱动
  4. 重启电脑

2.2 第二步:安装 CUDA Toolkit

步骤 1:下载 CUDA Toolkit

  1. 访问 CUDA Toolkit 下载页面:

    https://developer.nvidia.com/cuda-toolkit-archive
    
  2. 选择你需要的版本:

    • Sysplorer 2026 → 选择 CUDA 12.4
    • Sysplorer 2025 及以下 → 选择 CUDA 11.6
  3. 选择操作系统:

    • Operating System: Windows
    • Architecture: x86_64
    • Distribution: 1011
    • Installer Type: exe (local)(推荐)
  4. 点击下载,保存安装文件(约 2-4 GB)

步骤 2:安装 CUDA Toolkit

  1. 双击运行下载的 .exe 安装文件
  2. 选择 自定义安装
  3. 安装路径保持默认:
    C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X
    
  4. 勾选以下组件:
    • ✓ CUDA
    • ✓ Driver components(如果提示)
  5. 点击 "Agree and Continue",等待安装完成(约 5-10 分钟)
  6. 安装完成后重启电脑

步骤 3:验证安装

打开 PowerShell,输入:

nvcc --version

成功输出示例:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2024 NVIDIA Corporation
Cuda compilation tools, release 12.4, V12.4.99

如果显示版本信息,说明 CUDA 安装成功。


2.3 第三步:安装 cuDNN

步骤 1:下载 cuDNN

  1. 访问 cuDNN 下载页面:

    https://developer.nvidia.com/rdp/cudnn-download
    
  2. 登录 NVIDIA 账号(没有账号需免费注册)

  3. 选择与 CUDA 版本匹配的 cuDNN:

    • CUDA 12.4 → 下载 cuDNN 9.x
    • CUDA 11.6 → 下载 cuDNN 8.4.x
  4. 下载 Windows 版本:

    • Download cuDNN for Windows (x86_64)
    • 选择 Installer (exe)

步骤 2:安装 cuDNN

  1. 双击运行下载的 .exe 安装文件
  2. 选择 自定义安装
  3. 安装路径选择 CUDA 的安装目录:
    C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X
    
    (安装程序会自动检测 CUDA 路径)
  4. 完成安装

步骤 3:验证安装

方法一:检查文件是否存在

打开 PowerShell,输入:

dir "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\include\cudnn.h"
dir "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\bin\cudnn64_*.dll"

如果文件存在,说明 cuDNN 已正确安装。

方法二:在 PyTorch 中验证(安装 PyTorch 后)

import torch
print(f"cuDNN enabled: {torch.backends.cudnn.is_available()}")
print(f"cuDNN version: {torch.backends.cudnn.version()}")

成功输出:

cuDNN enabled: True
cuDNN version: 90100

2.4 第四步:安装 PyTorch(GPU 版本)

步骤 1:确认 Python 版本

确认 Python 版本:

  • Sysplorer 2026 → 对应 Python 3.11
  • Sysplorer 2025 → 对应 Python 3.7

如果 Python 解释器在某个软件的安装路径下,使用完整路径,可验证python版本:

"C:\完整\路径\python.exe" --version

步骤 2:安装 PyTorch

根据你的 Python 版本,选择对应的安装方式:


场景一:使用 Sysplorer 2026(Python 3.11 + CUDA 12.4)

方式 1:命令行安装(推荐,需要网络)

打开 cmd,切换至 Python 所在目录,切换至 Python 所在目录,输入:

python -m pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu124

例如:
3111.png

方式 2:使用 whl 文件安装(离线安装,无需网络)

步骤 1:下载 whl 文件

  1. 访问 PyTorch 下载页面:

    https://download.pytorch.org/whl/cu124/torch
    https://download.pytorch.org/whl/cu124/torchvision
    https://download.pytorch.org/whl/cu124/torchaudio
    
  2. 找到并下载以下 3 个文件(cu124 表示 CUDA 12.4):

    • torch-2.4.0+cu124-cp311-cp311-win_amd64.whl
    • torchvision-0.19.0+cu124-cp311-cp311-win_amd64.whl
    • torchaudio-2.4.0+cu124-cp311-cp311-win_amd64.whl

注意:cp311 表示 Python 3.11,win_amd64 表示 Windows 64 位系统

步骤 2:安装 whl 文件

将下载的 whl 文件放到同一目录,打开 cmd,切换至 Python 所在目录,输入:

python -m pip install torch-2.4.0+cu124-cp311-cp311-win_amd64.whl torchvision-0.19.0+cu124-cp311-cp311-win_amd64.whl torchaudio-2.4.0+cu124-cp311-cp311-win_amd64.whl  

注意事项:

  • cmd 中输入为 whl 文件的完整路径

例如:
3112.png


场景二:使用 Sysplorer 2025 及以下(Python 3.7 + CUDA 11.6)

方式 1:命令行安装(推荐,需要网络)

打开 cmd,切换至 Python 所在目录,输入:

python -m pip install torch==1.12.1+cu116 torchvision==0.13.1+cu116 torchaudio==0.12.1 --extra-index-url https://download.pytorch.org/whl/cu116

例如:

371.png

方式 2:使用 whl 文件安装(离线安装,无需网络)

步骤 1:下载 whl 文件

  1. 访问 PyTorch 历史版本下载页面:

    https://download.pytorch.org/whl/cu116/torch
    https://download.pytorch.org/whl/cu116/torchvision
    https://download.pytorch.org/whl/cu116/torchaudio
    
  2. 找到并下载以下 3 个文件:

    • torch-1.12.1+cu116-cp37-cp37m-win_amd64.whl
    • torchvision-0.13.1+cu116-cp37-cp37m-win_amd64.whl
    • torchaudio-0.12.1+cu116-cp37-cp37m-win_amd64.whl

注意:cp37 表示 Python 3.7,win_amd64 表示 Windows 64 位系统

步骤 2:安装 whl 文件

将下载的 whl 文件放到同一目录,打开 cmd,切换至 Python 所在目录,输入:

python -m pip install torch-1.12.1+cu116-cp37-cp37m-win_amd64.whl torchvision-0.13.1+cu116-cp37-cp37m-win_amd64.whl torchaudio-0.12.1+cu116-cp37-cp37m-win_amd64.whl        

例如:
372.png


通用注意事项:

  • 使用 python -m pip 确保安装到正确的 Python 环境
  • 命令行安装需要稳定的网络连接,如果下载速度慢,可使用国内镜像源
  • whl 文件安装适合离线环境或网络不好的情况

步骤 3:验证安装

打开 PowerShell,输入:

python -c "import torch; print(f'CUDA available: {torch.cuda.is_available()}')"

成功输出:

CUDA available: True

如果返回 False,请检查:

  1. CUDA 是否正确安装
  2. 是否安装了 GPU 版本的 PyTorch(不是 CPU 版本)

三、完整验证

运行以下 Python 代码,验证整个 GPU 环境是否正常:

import torch

# 1. 检查 CUDA 是否可用
print(f"CUDA available: {torch.cuda.is_available()}")

# 2. 检查 CUDA 版本
if torch.cuda.is_available():
    print(f"CUDA version: {torch.version.cuda}")
    print(f"GPU: {torch.cuda.get_device_name(0)}")
    print(f"cuDNN enabled: {torch.backends.cudnn.is_available()}")
    print(f"cuDNN version: {torch.backends.cudnn.version()}")

# 3. 简单 GPU 计算测试
if torch.cuda.is_available():
    device = torch.device('cuda')
    a = torch.randn(1000, 1000, device=device)
    b = torch.randn(1000, 1000, device=device)
    c = torch.matmul(a, b)
    print(f"GPU 计算测试通过!结果形状:{c.shape}")

完整成功输出示例:

CUDA available: True
CUDA version: 12.4
GPU: NVIDIA GeForce RTX 3060
cuDNN enabled: True
cuDNN version: 90100
GPU 计算测试通过!结果形状:torch.Size([1000, 1000])

四、常见问题

Q1: nvidia-smi 无法运行

解决: 显卡驱动未安装或未正确安装,重新安装 NVIDIA 驱动。

Q2: nvcc --version 无法运行

解决: CUDA 环境变量未配置,重启电脑或手动添加环境变量:

CUDA_PATH = C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4
Path = %CUDA_PATH%\bin

Q3: torch.cuda.is_available() 返回 False

解决:

  1. 确认安装的是 GPU 版本 PyTorch(查看版本号是否包含 +cu124+cu116
  2. 重新安装 PyTorch:
    pip uninstall torch torchvision torchaudio
    pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
    

Q4: 安装时提示版本不兼容

解决: 严格按照本文 1.2 节的版本组合安装,不要混用不同版本。


五、快速命令参考

# 检查驱动版本
nvidia-smi

# 检查 CUDA 版本
nvcc --version

# 检查 PyTorch 版本
python -c "import torch; print(torch.__version__)"

# 检查 GPU 是否可用
python -c "import torch; print(torch.cuda.is_available())"

# 查看 cuDNN 版本
python -c "import torch; print(torch.backends.cudnn.version())"

六、下载链接汇总

组件 下载链接
CUDA Toolkit 12.4 https://developer.nvidia.com/cuda-toolkit-archive
CUDA Toolkit 11.6 https://developer.nvidia.com/cuda-toolkit-archive
cuDNN 9.x https://developer.nvidia.com/rdp/cudnn-download
cuDNN 8.4 https://developer.nvidia.com/rdp/cudnn-download
NVIDIA 驱动 https://www.nvidia.cn/Download/index.aspx
PyTorch 历史版本 https://download.pytorch.org/whl/torch_stable.html

按照以上步骤操作,即可完成 GPU 环境的完整配置。

所属专栏:工具箱
产品信息:模型降阶及融合仿真工具
系统建模安装激活AIMWORKS AI

全部回答

暂无数据
暂无数据
用户
和原帖交流更多问题细节吧,去
我要发帖 我要发帖
资料中心 资料中心
查看更多>
热门帖子 热门帖子
主要贡献者 主要贡献者
过去7天