zoukankan      html  css  js  c++  java
  • python数据分析的工具环境

    python做数据分析的优势:

    1. 拥有大量的库为数据分析和处理提供了完整的工具链
    2. 随着库还在不断的增加的同时, 算法的实现也更加的创新。Numpy, matplotlib, scipy,scikit-learn
    3. python还能和其他多语言对接,比如C语言等
    4. 相对于R和MATLAB,python可做的事情更多, 一系列的连贯性更加好, 如web开发,爬虫,脚本、运维、机器学习

    环境:

    将使用 Anaconda 作为数据分析的工具(在后续的KNN近邻算法, 线性回归等也同样会用Anaconda来完成)

    Anaconda : 一个跨语言、跨系统的集包管理、环境管理于一身的工具

    Anaconda的特点: - 开源 - 安装使用简便, 且已集成大量现有库 - 支持python和R语言

    下载地址: https://www.anaconda.com/download

    安装过程 :

    windows 注意: - 选just for me 选项 - 添加到path 中 - 安装完后在开始菜单可以看到如下图显示:

    Linux 注意: - 添加到.bashrc文件,并source这个文件

    安装完成以后,如何检查是否已经安装成功: ``` conda --version ```

    升级到最新版本 ``` conda update conda ```

    这儿可以自行把源修改为国内的清华源地址 (不改也行), 但帅的人都会改, 下载包的速度确实很快 , 清华源地址:

    https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/

    具体修改: 根据上图, 打开Anaconda Prompt , 输入下列代码即可

    1 # 添加清华源
    2     conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    3     conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
    4     # 设置在下载的时候显示源的Url
    5     conda config --set show_channel_urls yes
    6     # 查看源是否已经添加成功
    7     conda config --show channels

    使用conda配置环境创建环境

    1 # 创建一个名为py36的环境,指定python版本为3.6
    2     # (不管是指定哪个版本,conda会为我们自动寻找最新的版本,注意,这儿选的是python3.6,是会自动选择3.6版本里的最新小版本, 比如3.6.x,而不是整个python的大版本)
    3     conda create --name py36 python=3.6

    激活环境

    1  # 在windows下直接输入 activate 激活
    2     activate py36
    3     # 在Linux或者Mac下,使用 source activate 激活
    4     source activate py36

    激活以后,会发现控制台的命令行前面多了个(py36)的字样,这表示我们已经进入py35的环境里了

    1  # windows退出环境
    2     deactivate py36    
    3     # Linux退出环境
    4     source deactivate py36
    5 
    6     # 删除环境
    7     conda env remove -n py36

    使用conda做包管理 查看已经安装的包

    1 # 查看当前环境中的包,已安装的包和对应的版本
    2     conda list
    3     # 查看指定环境内的包
    4     conda list -n py36

    查找某个包

    1  # 查找指定的包是否可以通过conda来安装
    2     # 会返回这个包的信息,如果能看到相关信息,说明这个包可能用conda来安装
    3     conda search numpy
    4     # 如果卡着不动,有可能网络原因,可以使用--offline参数
    5     conda search numpy --offline

    安装包

     1 # 通过conda来安装Numpy 2 # 如果numpy已经安装,会提示已安装 3 conda install numpy 

    更新包

     1 # 通过conda更新包 2 conda update numpy 

    卸载包

     1 conda remove numpy 

    以上就是conda对包的安装、更新、卸载。conda将conda、python、pip都视为包,因此,完全可以使用conda来管理conda和python的版本,比如:

    1  # 将conda更新到最新版本
    2     conda update conda
    3     # 同样的,也可以更anaconda到最新版本
    4     conda update anaconda
    5     # 更新python
    6     # 比如我们现在是python3.6.4,执行下面的命令,就会更新到python3.6.x的最新版本(例如3.6.5)
    7     conda update python

    conda 和virtualenv / pip 的关系和区别

    anaconda包含了navigator、prompt、conda、jupyter这些工具,同时也包含了python、pip、virtualenv等工具库

    conda和pip的关系:

    • conda是包管理和环境管理工具,conda还支持多种环境的管理,包括python、R,注意:包括语言本身,不仅仅是语言的包 -
    • pip仅仅是python的包管理工具 -
    • conda不会影响系统自带的python

    conda和virtualenv的关系:

    • conda是结合了pip和virtualenv的功能
    • conda可以创建多个Python版本的虚拟环境
    • virtualenv只能创建指定版本的环境

    如何判断管理虚拟环境

    1     # 查看pip的绝对路径
    2     which pip
    3     # 查看当前环境中的pip使用的是什么python
    4     cat $(which pip)

    我们可以编辑pip文件中的第一行,来改变我们的pip使用的python解释器

    vim $(which pip)

     1  #! /Users/guye/anaconda/envs/py36/bin/python
     2     
     3     # -*- coding: utf-8 -*-
     4     import re
     5     import sys
     6     
     7     from pip._internal import main
     8     
     9     if __name__ == '__main__':
    10         sys.argv[0] = re.sub(r'(-script.pyw?|.exe)?$', '', sys.argv[0])
    11         sys.exit(main())

    或者也可以直接写pip的绝对路径来安装包

    jupyter notebook的使用

    启动juypter (会自动打开电脑默认设置的浏览器,我这儿的默认浏览器是谷歌)

    1 # 在默认地址和端口启动jupyter
    2     jupyter notebook 
    3     # 在指定地址和端口启动
    4     jupyter notebook --ip=0.0.0.0 --port=8000

    自定义jupyter界面

     
    1 # 创建一个目录 .jupyter/custom
    2     mkdir -p ~/.jupyter/custom
    3     # 添加编辑custom.js或者custom.css
    4     vim custom.js
    5     # 在js文件内写javascript代码

     


    技术交流可以留言评论哦 ! 虚心学习, 不忘初心, 共同奋进 !

  • 相关阅读:
    添加GDataXMLNODE.h和.m的方法
    NSPredicate的用法
    oc正则表达式基本语法(二)
    洛谷3931 [洛谷八连测] 一道难题
    洛谷2024 食物链 并查集
    洛谷1005 【NOIP2007】矩阵取数游戏
    洛谷3927 [洛谷八连测] 一道中档题
    洛谷1113 杂务
    洛谷1019 单词接龙 字符串dfs
    洛谷1414 又是毕业季II
  • 原文地址:https://www.cnblogs.com/wylycool/p/9275554.html
Copyright © 2011-2022 走看看