zoukankan      html  css  js  c++  java
  • Ubuntu系统崩后整理小结

    首先是装系统,总是在最后安装那一步,出一些未知名的BUG,每次提示的大概意思是: 拷问的文件xxxx跟目标不匹配,可能会引起主机发热什么的。 查了下原因,网上大概意思是 系统盘 可能是插在了USB3.0的口上了,需要换成 USB2.0 的口重新安装,然而我本来就是插在USB2.0的口啊 (??黑人脸??)。 最后安装成功是用自己电脑,重新烧了一个 Ubuntu16.04 进U盘,并且插在主机的USB3.0的口上,完成了系统安装。(Ubuntu16.04 )

    第二步就是更新的 apt 和 PIP的源,这个源就是你每次安装时,搜索的安装包的下载网站,相比于国外原生的地址,国内的网站显然要下载的更快些。

    1.apt的源,针对我自己的电脑,这里一定要是 阿里云 的源,否则会导致显卡驱动安装失败!!!

    >> sudo gedit /etc/apt/sources.list 
    
    #替换成如下内容
    deb-src http://archive.ubuntu.com/ubuntu xenial main restricted #Added by software-properties
    deb http://mirrors.aliyun.com/ubuntu/ xenial main restricted
    deb-src http://mirrors.aliyun.com/ubuntu/ xenial main restricted multiverse universe #Added by software-properties
    deb http://mirrors.aliyun.com/ubuntu/ xenial-updates main restricted
    deb-src http://mirrors.aliyun.com/ubuntu/ xenial-updates main restricted multiverse universe #Added by software-properties
    deb http://mirrors.aliyun.com/ubuntu/ xenial universe
    deb http://mirrors.aliyun.com/ubuntu/ xenial-updates universe
    deb http://mirrors.aliyun.com/ubuntu/ xenial multiverse
    deb http://mirrors.aliyun.com/ubuntu/ xenial-updates multiverse
    deb http://mirrors.aliyun.com/ubuntu/ xenial-backports main restricted universe multiverse
    deb-src http://mirrors.aliyun.com/ubuntu/ xenial-backports main restricted universe multiverse #Added by software-properties
    deb http://archive.canonical.com/ubuntu xenial partner
    deb-src http://archive.canonical.com/ubuntu xenial partner
    deb http://mirrors.aliyun.com/ubuntu/ xenial-security main restricted
    deb-src http://mirrors.aliyun.com/ubuntu/ xenial-security main restricted multiverse universe #Added by software-properties
    deb http://mirrors.aliyun.com/ubuntu/ xenial-security universe
    deb http://mirrors.aliyun.com/ubuntu/ xenial-security multiverse
    
    #接着就是更新下
    >> sudo apt-get update

    2.pip的源

    >> mkdir -p ~/.pip/pip.conf
    
    #然后填入以下内容并保存
    
    [global] 
    index-url = http://mirrors.aliyun.com/pypi/simple/ 
    [install] 
    trusted-host=mirrors.aliyun.com 

    上面两个基本工作做完后,就可以开始装驱动了,我是直接用apt-get安装的,网上有三种安装方式,但这种是最有效的。

    >> sudo apt-get install nvidia-384
    #安装完后,需要重启下电脑
    >> sudo reboot
    #重启后,在命令行就可以检测到显卡驱动安装成功了。
    >> nvidia-smi


    #如果安装显卡驱动后,登录进入循环界面,不要慌。跟着我做
    >> Ctrl + Alt + F1
    #输入用户名与密码后,卸载已安装的显卡驱动
    >> sudo apt-get remove --purge nvidia-*
    >> sudo apt-get autoremove
    >> sudo apt-get install -f
    >> sudo reboot
    #恩、、到此就当什么都没装过。。。。寻找适合自己的显卡驱动版本或者其他安装方法吧。

    不知道为什么,我的电脑只能装384版的,如果是390或者其他版本的驱动,安装最后有一段显示 :

    。。。
    ERROR (dkms apport): There was a segmentation fault when trying to build the module Error! Bad return status for module build on kernel: 4.4.0-21-generic (x86_64)
    。。。

    猜测应该是不兼容的原因吧。

    总之安装显卡驱动是最困难的,对我来说太玄学了。我刚开始也试着装过 nvidia-384 ,但是失败了。 经过一系列尝试发现,当我把 apt 的源从 清华源 换成 阿里云源后,竟然奇迹的安装成功了,也不会出现电脑重启后循环登录界面的情况。以上的这些过程折腾了我好多天的时间。

    下面装cuda+cudnn就简单的多了,从官网上下一个cuda8.0或者cuda9.0的.run文件:

    >> sudo chmod +x cuda_9.0.176_384.81_linux.run
    >> sudo ./cuda_9.0.176_384.81_linux.run
    
    #第二个问是否安装显卡驱动时,选择 no 因为之前已经安装过了。
    #其他都是 y 或者 默认路径即可

    #cuda安装好后,需要添加两个路径到 ~/.bashrc 文件最后
    export PATH=/usr/local/cuda-9.0/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
    #保存后使文件生效
    >> source ~/.bashrc

    #配置cudnn,官网下载好自己需要的版本
    >> sudo tar -xzf cudnn-9.0-linux-x64-v7.1.tgz -C /usr.local/

    有一点需要知道的是,cuda安装完成后,只会生成/usr/local/cuda-9.0文件夹。所以想要卸载cuda时:

    >> cd /usr/local/cuda-9.0/bin
    >> sudo ./uninstall_cuda_9.0.pl
    
    #卸载完成后,在把cuda-9.0文件夹删除,即可
    >> sudo rm -rf /usr/local/cuda-9.0

    最后一步就是安装caffe2了,也是由于很多不知名的原因(由于我之前安装的是cuda8,因该是不兼容),导致每次从源码编译caffe2时,很多报错,经常就是缺依赖,等等。也没成功过,最后放弃。还是选择了用anaconda,直接conda install pytorch-nightly -c pytorch .这里也是个重点,以为如果直接 conda install pytorch 的话,下载的是 pytorch0.4.2,而这版本是不包含caffe2的。所以必须是pytorch-nightly ,这个才是1.0的版本!!! 

    倒腾了正好5天时间,心累。 不知道为什么自己总是遇到各种玄之又玄的BUG。。。研究生3年,其他的不敢说,装机我小能手!!! 各种bug最终都被我解决了(虽然还是不清楚其中的原因。。。)难受。

    哦,刚刚有碰到了一个问题。系统重启后,直接进入了busybox。查了下,是系统文件出了问题,所以我就按照提示(/dev/sdb7 xxxxxx)

    fsck.ext4 -y /dev/sdb7
    
    reboot

    电脑会重启,然后就正常开机了。

  • 相关阅读:
    cuda9.0 中不存在libnppi.so
    深度学习训练踩坑记
    采用代理之后,pip 运行报错socks
    摄像机模型
    段错误:使用opencv打开视频流
    ffmpeg+cuda+opencv
    pip install xxx -i https://pypi.tuna.tsinghua.edu.cn/simple
    【TCP/IP详解】BOOTP:引导程序协议
    【TCP/IP详解】TFTP:简单文件传送协议
    【TCP/IP详解】IGMP Internet组管理协议
  • 原文地址:https://www.cnblogs.com/caffeaoto/p/9860838.html
Copyright © 2011-2022 走看看