zoukankan      html  css  js  c++  java
  • github上DQN代码的环境搭建,及运行(Human-Level Control through Deep Reinforcement Learning)conda配置

    最近师弟在做DQN的实验,由于是强化学习方面的东西,正好和我现在的研究方向一样于是我便帮忙跑了跑实验,于是就有了今天的这个内容。

    首先在github上进行搜寻,如下图:

    发现第一个星数最多,而且远高于其它的项目,于是拉取这个链接:

    https://github.com/devsisters/DQN-tensorflow

    本篇博客主要是讲解一下该代码运行环境的如何搭建,采用  conda 配置。

    首先看下  README  上的内容, 主要是requirement最重要:

    考虑到运行的兼容性,于是决定使用python2.7版本环境运行,下面开始  conda  的配置:

    搜寻python2.7版本,并采用最小自版本号

    conda search python=2.7

    选择  python2.7.3版本, 为环境命名 dqn_2  :

    conda create -n dqn_2  python=2.7.3

    进入新建环境,并确认版本:

    conda activate dqn_2

    安装    numpy  scipy

    conda install numpy scipy

     

    安装   tqdm   (进度条模块)

    pip install tqdm==4.30

    安装   gym     (oepnai 的  游戏环境交互模块)

    可选安装:

    pip install gym==0.1.0

    必选安装:

    pip install gym[Atari]==0.1.0

    安装  gpu 计算环境    cudatookit    和     cudnn(由于需要安装深度学习框架   tensorflow-gpu ,  python27  0.12.1  版本。)

    由于安装的tensorflow-gpu 0.12.1 所依赖的 环境,我们选择  cudatookit8.0   cudnn5.1

    如下图:

    conda install cudatoolkit=8.0=3

    conda install cudnn=5.1.10=cuda8.0_0

    安装深度学习框架   tensorflow-gpu ,  选择python27  0.12.1  版本。

    给出下载地址:

    https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-0.12.1-cp27-none-linux_x86_64.whl

    pip install tensorflow_gpu-0.12.1-cp27-none-linux_x86_64.whl

    为运行环境设置动态库地址, 目的是为了要 程序知道安装的cudatookit和cudnn的lib位置:

    export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/devil/anaconda3/envs/dqn_2/lib

    其中,   dqn_2   为conda 中所设置的运行环境名称。

    运行:

    python main.py --env_name=Breakout-v0 --is_train=True

    配置成功,  并且可运行。

    参考资料:

    https://blog.csdn.net/u011636567/article/details/77162217

  • 相关阅读:
    iperf使用
    性能工具--vtune
    Android广告轮播图实现
    自定义控件学习——下拉刷新ListView
    JVM读书笔记
    自定义控件学习——仿qq侧滑栏
    初步使用RecyclerView实现瀑布流
    自定义Toast
    自定义对话框加状态选择器
    自定义组合控件
  • 原文地址:https://www.cnblogs.com/devilmaycry812839668/p/10436416.html
Copyright © 2011-2022 走看看