1、NVIDIA官网下载相关显卡驱动
#在服务器上查看网卡型号lspci -mm | grep NVIDIA#在NVIDIA官网下载相应型号驱动程序https://www.geforce.cn/drivers |
2、Centos7 升级最新4.4内核
#安装kernel reposudo rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-3.el7.elrepo.noarch.rpm#安装最新版本kernelsudo yum --enablerepo=elrepo-kernel install -y kernel-lt#查看安装情况cat /boot/grub2/grub.cfg |grep menuentry | grep 4.4#设置系统默认启动内核(注:根据grub.cfg中的具体情况设置内核,以下命令仅为参考)grub2-set-default 'CentOS Linux (4.4.166-1.el7.elrepo.x86_64) 7 (Core)'#查看默认启动内核grub2-editenv list#重启服务器shutdown -r now |
3、准备GPU驱动安装环境
#此步骤顺序不能颠倒,按照顺序执行#卸载原有内核的header与devel模块yum -y remove kernel-headers kernel-devel#安装现有内核headers和devel模块(必须,显卡编译需要)yum --enablerepo=elrepo-kernel install -y kernel-lt-devel-$(uname -r) kernel-lt-headers-$(uname -r)#安装编译依赖模块(卸载旧的kernel模块时会同时卸载旧版本的gcc模块)yum -y install gcc#修改/etc/modprobe.d/blacklist.conf 文件,以阻止 nouveau 模块的加载#注释 blacklist nvidiafbblacklist nvidiafb #找到并注释此配置#在文件尾部添加:blacklist nouveauoptions nouveau modeset=0#重新建立initramfs image文件mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bakdracut /boot/initramfs-$(uname -r).img $(uname -r)#重启服务器并查看模块是否加载shutdown -r nowlsmod | grep nouveau #如果没有输出,代表禁止模块加载成功 |
4、编译安装GPU驱动
#修改驱动程序的执行权限chmod u+x NVIDIA-Linux-x86_64-410.78.run#执行安装命令(/usr/src/kernels目录下文件需要安装kernel-devel包后才会出现),具体的安装包与内核路径根据实际情况填写./NVIDIA-Linux-x86_64-410.78.run --kernel-source-path=/usr/src/kernels/4.4.166-1.el7.elrepo.x86_64 -k $(uname -r) -s#查看显卡驱动是否安装成功nvidia-smi #如果显示GPU信息,代表显卡驱动安装成功 |