Tesla V100 双卡 NVIDIA 驱动与 CUDA 12.8 安装
硬件环境:Tesla V100 16G x2, Ubuntu 22.04, GCC 12.3, Kernel 6.8.0-85, NVIDIA Driver 570.172.08, CUDA 12.8
检查驱动和硬件
lspci | grep V100
lsmod | grep nvidia
检查当前系统内核
uname -r
禁用核心显卡驱动
sudo bash -c "echo 'blacklist nouveau' >> /etc/modprobe.d/blacklist-nouveau.conf"
sudo bash -c "echo 'options nouveau modeset=0' >> /etc/modprobe.d/blacklist-nouveau.conf"
更新 initramfs 并重启
sudo update-initramfs -u && sudo reboot
验证是否禁用(无输出即可)
lsmod | grep nouveau
检查 GCC 版本
gcc --version
sudo apt install gcc-12 g++-12
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 100
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-12 100
清理旧驱动
sudo apt purge '*nvidia*' '*cuda*'
升级内核
sudo apt update
sudo apt upgrade
安装指定版本内核以及扩展功能:
sudo apt install -y linux-image-6.8.0-85-generic \
linux-headers-6.8.0-85-generic \
linux-modules-extra-6.8.0-85-generic
安装完毕重新启动,并进行检测:
# 检查内核文件是否已安装
ls /boot/vmlinuz-6.8*
输出应为 6.8.0-85。验证内核版本:

