zoukankan      html  css  js  c++  java
  • 安装 tensorflow 1.1.0;以及安装其他相似版本tensorflow遇到的问题;tensorflow 1.13.2 cuda-10环境变量配置问题;Tensorflow 指定训练时如何指定使用的GPU;

    # 安装 2.7 环境
    conda create -n python2.7 python=2.7.17 conda activate python2.7
    # 安装 1.1.0 gpu版本
    pip install tensorflow-gpu==1.1.0
    # 配置环境变量
    export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64
    export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64:/usr/local/cuda-8.0/extras/CUPTI/lib64
    # tensorflow1.13.2 cuda-10 lib库配置; 因为tensorflow 1.13版本以上要求cuda 10
    export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:/usr/local/cuda/lib64:/home/v-yaxu/nccl/build/lib 

    保持更新,更多内容请关注 cnblogs.com/xuyaowen; 

    常用操作:

    tensorboard --logdir=/tmp/tensorflow/mnist/logs/mnist_with_summaries/ 

    参考链接:

    https://www.cnblogs.com/chay/p/10472993.html 

    https://blog.csdn.net/weixin_35653315/article/details/71308137 

    "ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory."?

    export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64

    (解决使用 tensorflow 使用过程中,libcublas 库,找不到的错误)

    Tensorflow 指定训练时使用的GPU:

    场景:有一台服务器,服务器上有多块儿GPU可以供使用,但此时只希望使用第2块和第4块GPU,但是我们希望代码能看到的仍然是有两块GPU,分别编号为0,1,这个时候我们可以使用环境变量CUDA_VISIBLE_DEVICES来解决;

    import os
    os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID" # cuda 模式按照进行gpu的性能进行排序,设置此环境变量,GPU的顺序,将按照 pci_bus_id编号来进行设置;gpu顺序;这样在cuda_visble_devices环境变量就可以按照pci编号来进行选择gpu了; os.environ[
    "CUDA_VISIBLE_DEVICES"] = "0" # 设置程序环境变量;
    或在脚本或者命令行中指定:export CUDA_VISIBLE_DEVICES=0 
    CUDA_VISIBLE_DEVICES=1 只有编号为1的GPU对程序是可见的,在代码中gpu[0]指的就是这块GPU
    CUDA_VISIBLE_DEVICES=0,2,3 只有编号为0,2,3的GPU对程序是可见的,在代码中gpu[0]指的是第0块,gpu[1]指的是第2块,gpu[2]指的是第3块
    CUDA_VISIBLE_DEVICES=2,0,3 只有编号为0,2,3的GPU对程序是可见的,但是在代码中gpu[0]指的是第2块,gpu[1]指的是第0块,gpu[2]指的是第3块

    指定GPU占用显存:

    gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.7) # 确保每个GPU使用的显存,不超过 0.7
    sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options)) 

    Tesorflow 默认会占用gpu 所有缓存,设置按需占用GPU缓存方法:

    config = tf.ConfigProto()
    config.gpu_options.allow_growth = True
    session = tf.Session(config=config)

    GPU 设置参考链接:

    https://homepages.uc.edu/~schreihf/uchenry/post/using-gpus/ (gpu设置)

    https://www.jianshu.com/p/0816c3a5fa5c 

    https://www.cnblogs.com/darkknightzh/p/6591923.html 

    https://www.tensorflow.org/guide/gpu (tensorflow 官方关于gpu使用的说明文档)

    https://github.com/tensorflow/docs/blob/r1.13/site/en/guide/using_gpu.md (官方关于 tf.1.13的gpu使用文档)

    设置参考自网络,如果失效,请纠正;

  • 相关阅读:
    nginx
    spring 学习
    mysql 免安装 操作
    院感干预 报错
    iis 无法绑定 net.tcp
    wangEditor 自定义 菜单
    院感干预 发布
    第17篇 shell编程基础(2)
    第16篇 Shell脚本基础(一)
    第15篇 PSR-04 规范
  • 原文地址:https://www.cnblogs.com/xuyaowen/p/tensorflow-1-1-0.html
Copyright © 2011-2022 走看看