zoukankan      html  css  js  c++  java
  • Jupyter自定义设置详解

    今天专门花时间总结梳理一下jupyter的一些高级设置,jupyter我已经介绍过一次基本内容了,Setup and Linux | James Chen’s Blogs,尤其是如何在服务器运行jupyter并且在本地浏览器显示,简直是使用python进行机器学习、深度学习、大数据的工作者的巨大福音。作为一个重度python&jupyter使用者,我已经习惯于在jupyter上进行大量的实验以及一次性的小工作、作业,需要跑很久的代码才会在运行通过后用VSCode编辑一下提交上去跑。用jupyter写了很多脚本,尤其适合可视化、展示和教学。可以在我的GitHub找到很多用jupyter写的代码,事实上很多教程和实验大家也都习惯于jupyter做了,比如我在这篇Deep Learning Practice介绍的资源中就有大量用jupyter写的。

    下面就讲一下jupyter的一些高级玩法。

    自定义主题

    https://github.com/dunovank/jupyter-themes
    Markdown

    jupyter extension

    相见恨晚,用着非常非常爽,强烈推荐
    https://github.com/ipython-contrib/jupyter_contrib_nbextensions

    1
    2
    3
    4
    pip install jupyter_contrib_nbextensions
    jupyter contrib nbextension install --user
    pip3 install jupyter_contrib_nbextensions
    jupyter contrib nbextension install --user

    推荐使用的插件

    table of contents

    设置着很简单,找到后打个对勾就行了,效果很棒
    Markdown

    jupyter支持markdown,只需要将某个代码框选为markdown格式,使用table of contents插件,就会自动在左边栏生成目录。对于写的很长的代码,可以帮助整理思路,快速定位代码。大家用jupyter一般是做前期的各种各样的实验,思路可能比较发散,所以用table of contents可以帮忙梳理思路,也方便以后再寻找、理解代码

    freeze

    可以“冰冻”某个代码块,有个代码块儿暂时不再使用,就可以暂时冰冻,这样就无法运行,也不会被误删除。是个很有用的功能。
    Markdown

    highlighter

    可以高亮注释
    Markdown

    Gist-it

    Adds a button to publish the current notebook as a gist

    Snippets menu

    帮助懒人插入一些经典库的经典方法的代码块,感觉很不错哦,比去Stack Overflow搜要快一些~不过支持的还是比较少的。
    Markdown

    Snippet:

    强烈强烈推荐!感觉有望帮助节约不少写代码的时间

    Markdown

    This extension adds a drop-down menu to the IPython toolbar that allows easy insertion of code snippet cells into the current notebook. The code snippets are defined in a JSON file in nbextensions/snippets/snippets.json and an example snippet is included with this extension

    Snippets are specified by adding a new JSON block to the list of existing snippets in $(jupyter —data-dir)/nbextensions/snippets/snippets.json. (I put my customized json file in jupyter-notebooks directory in /Users/james/) For example, to add a new snippet that imports numpy, matplotlib, and a print statement, the JSON file should be modified。

    先分别列一下各种情景下需要导入哪些库:

    Basic science
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    import argparse, sys, os, errno
    %pylab inline
    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    plt.style.use('ggplot')
    import seaborn as sns
    import h5py
    import os
    from tqdm import tqdm
    import scipy
    import sklearn
    from scipy.stats import pearsonr
    import warnings
    warnings.filterwarnings('ignore')
    Highlevel plot
    1
    2
    3
    4
    5
    6
    7
    8
    import matplotlib.animation as animation
    from matplotlib import rc
    from IPython.display import HTML, Image
    rc('animation', html='html5')
    import plotly
    import plotly.offline as off
    import plotly.plotly as py
    import plotly.graph_objs as go
    Deeplearning keras
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    import keras
    from keras import backend as K
    from keras.callbacks import TensorBoard
    from keras.callbacks import EarlyStopping
    from keras.optimizers import Adam
    from keras.callbacks import ModelCheckpoint
    import tensorflow as tf
    from keras.models import Model
    from keras.layers import Input, Conv2D, MaxPooling2D, UpSampling2D,Lambda, Dot,average,add, concatenate
    from keras.layers.normalization import BatchNormalization
    from keras.layers.core import Dropout, Activation,Reshape
    from keras.layers.merge import concatenate
    from keras.callbacks import TensorBoard, EarlyStopping, ModelCheckpoint
    from keras.initializers import RandomNormal
    import os
    os.environ['CUDA_DEVICE_ORDER'] = 'PCI_BUS_ID'
    os.environ['CUDA_VISIBLE_DEVICES'] = '4'
    from keras.backend.tensorflow_backend import set_session
    config = tf.ConfigProto()
    config.gpu_options.per_process_gpu_memory_fraction = 0.99
    (tf.Session(config=config))
    Pytorch
    1
    2
    3
    4
    import torch
    import math
    import torch.nn as nn
    import torch.nn.functional as F

    总结起来就是下面这样,注意语法别错,东西一多看着还是很头疼的,配置好就可以用了。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    大专栏  Jupyter自定义设置详解e">40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    {
    "snippets" : [
    {
    "name" : "science basic",
    "code" : [
    "import argparse, sys, os, errno",
    "%pylab inline",
    "import numpy as np",
    "import pandas as pd",
    "import matplotlib.pyplot as plt",
    "plt.style.use('ggplot')",
    "import seaborn as sns",
    "import h5py",
    "import os",
    "from tqdm import tqdm",
    "import scipy",
    "import sklearn",
    "from scipy.stats import pearsonr",
    "import warnings",
    "warnings.filterwarnings('ignore')"
    ]
    },
    {
    "name" : "high level plot",
    "code" : [
    "import matplotlib.animation as animation",
    "from matplotlib import rc",
    "from IPython.display import HTML, Image",
    "rc('animation', html='html5')",
    "import plotly",
    "import plotly.offline as off",
    "import plotly.plotly as py",
    "import plotly.graph_objs as go"
    ]
    },
    {
    "name" : "deep learning",
    "code" : [
    "import keras",
    "from keras import backend as K",
    "from keras.callbacks import TensorBoard",
    "from keras.callbacks import EarlyStopping",
    "from keras.optimizers import Adam",
    "from keras.callbacks import ModelCheckpoint",
    "import tensorflow as tf",
    "from keras.models import Model",
    "from keras.layers import Input, Conv2D, MaxPooling2D, UpSampling2D,Lambda, Dot,average,add, concatenate",
    "from keras.layers.normalization import BatchNormalization",
    "from keras.layers.core import Dropout, Activation,Reshape",
    "from keras.layers.merge import concatenate",
    "from keras.callbacks import TensorBoard, EarlyStopping, ModelCheckpoint",
    "from keras.initializers import RandomNormal",
    "import os",
    "os.environ['CUDA_DEVICE_ORDER'] = 'PCI_BUS_ID'",
    "os.environ['CUDA_VISIBLE_DEVICES'] = '4'",
    "from keras.backend.tensorflow_backend import set_session",
    "config = tf.ConfigProto()",
    "config.gpu_options.per_process_gpu_memory_fraction = 0.99",
    "set_session(tf.Session(config=config))"
    ]
    },
    {
    "name" : "pytorch",
    "code" : [
    "import torch",
    "import math",
    "import torch.nn as nn",
    "import torch.nn.functional as F"
    ]
    }
    ]
    }

    这个配置这里坑了我很久,主要是snippets不会显示错误信息,debug得很仔细一个一个找,因此花了很久发现是keras部分的几个破双引号冲突了,还有一个注释竟然也忘删了,折腾了很久才配置好。用sublime text是可以很容易发现语法错误的,可惜最开始没在意

    本地的snippets.json在:

    1
    /Users/james/Library/Jupyter/nbextensions/snippets/snippets.json

    我在james目录下也放了一份,因为最近估计需要不断更新完善,所以就放一份在:

    1
    /Users/james/snippets.json

    每次修改后,需要同步到本地以及ibme、cnode、hpc1几个机器上面,这样不用我几个地方都各自改一遍,费事。

    首先找到各个机器上的json文件在哪儿

    1
    $(jupyter --data-dir)/nbextensions/snippets/snippets.json

    然后写个同步的脚本syncsnip.sh

    1
    2
    3
    4
    cp /Users/james/snippets.json /Users/james/Library/Jupyter/nbextensions/snippets/snippets.json
    rsync -avzh /Users/james/snippets.json ibme:/Share/home/chenxupeng/.local/share/jupyter/nbextensions/snippets/
    rsync -avzh /Users/james/snippets.json cnode:/home/chenxupeng/.local/share/jupyter/nbextensions/snippets/snippets.json
    rsync -avzh /Users/james/snippets.json hpc1:/home/chenxupeng/.local/share/jupyter/nbextensions/snippets/

    然后做个同步快捷方式:

    1
    alias snip='bash syncsnip.sh'

    测试几个机器的配置均通过

    配置好了还是很美的:

    Markdown

    jupyter dashboard
    看起来是可以进一步帮助展示的利器

    1
    2
    3
    4
    pip install jupyter_dashboards
    jupyter dashboards quick-setup --sys-prefix
    jupyter nbextension install --py jupyter_dashboards --sys-prefix
    jupyter nbextension enable --py jupyter_dashboards --sys-prefix

    不过用了一下,过分自动化的布局反而限制的比较死,,不太好看

    hide input

    不显示code,只显示output,适合展示时用。

    ipywidgets interactive coding

    使用专为jupyter设计的ipywidgets,可以更好地展示、调整代码,尤其适合运行较快、有较多参数需要探索、选取的场合,比如绘图

    以使用python的seaborn绘制boxplot为例,我们有多个参数待选,比如:

    • context & style 可以设置不同的背景和字体风格
    • width & height 设置图片的宽和高
    • boxplot/violinplot 使用传统的box表示还是用可以同时表示点的分布密度的violinplot表示
    • showdot & showbox 可以选择是否显示点,以及是否显示box,或者同时都显示、都不显示
    • fondsize & dotsize,分别调整文字大小和点的大小
    • boxwidth 调整box和violin的宽度
    • ylim 调整纵坐标的最大与最小值
    • compareheight* 调整几个注释文字距离box顶点的高度
    • palettesind 选择第几套配色方案
    • saturation 调整色彩饱和度

    可以看到python的绘图函数一般都留有很大的调整空间,可选参数较多,可以组合出很多效果,但是也给调整带来了很多麻烦。如果把这些参数都传入绘图函数中,每次调整其中的一个或几个,依照经验来调整,效率就比较低。这个时候就可以考虑使用ipywidgets方便地调整这些参数。通过ipywidgets,可以把这些控制浮点型、整型或字符串控制参数用Float、Int slider、Dropdown,RadioButtion等控制,不需要每次更改参数再运行代码框,可以快速地调整出自己想要的图像。

    效果如下:

    Markdown

    一份示例代码plots_roc.ipynb放在了something more

  • 相关阅读:
    Android二维码扫描功能的集成开发
    【IMOOC学习笔记】多种多样的App主界面Tab实现方法(四)
    【IMOOC学习笔记】多种多样的App主界面Tab实现方法(三)
    【IMOOC学习笔记】多种多样的App主界面Tab实现方法(二)
    【IMOOC学习笔记】多种多样的App主界面Tab实现方法(一)
    【第一行代码笔记】(一)
    Android viewpager切换到最后一页时,跳转至其他activity
    scrapy爬取天气数据
    nodejs压缩
    Express文件上传
  • 原文地址:https://www.cnblogs.com/lijianming180/p/12302593.html
Copyright © 2011-2022 走看看