zoukankan      html  css  js  c++  java
  • Python数据分析开发环境

    准备工作

    下载并安装最新版本的Anaconda

    下载并安装最新版本的Visual Studio Code

    编辑器

    Tips:

    可以选择自己喜欢并且熟悉的编辑器或IDE。如:VIM、Emacs、Notepad++、Sublime、Pycharm等。

    如果安装的是完整版本的Anaconda,会默认安装Spyder以及Jupyter Notebook。那么不想折腾编辑器的话,推荐使用这两款应用是足够的。

    Visual Studio Code

    推荐插件

    • Python

    可选插件

    • vscode-icons

    包管理器选择

    Conda

    Conda是目前比较常用的包管理工具,其大致功用于pip类似,这里使用Conda的原因,主要在于Conda除可以安装python的包外,还可以很方便的安装其他变成语言的包(如C++、C等)。这样的话,就可以很方便的解决有些数据分析的包依赖非python编写的程序包的问题。

    为了能够直接在命令行中使用conda命令,这里将Anaconda3Scripts目录添加到了环境变量中。

    基本使用

    创建虚拟环境:conda create -n <env_name> python=<python_version_num>

    激活虚拟环境:activate <env_name>

    安装程序包到指定虚拟环境:conda install -n <env_name> <pakcage_name>

    关闭虚拟环境:deactivate

    删除虚拟环境:conda remove <env_name> --all

    删除虚拟环境中的某个包:conda remove --name <env_name> <package_name>

    查看已安装包:conda list

    查看已安装环境:conda env list

    检查更新conda:conda update conda

    更新所有程序包:conda update --all

    常用包安装

    安装好Anaconda后,可以使用Anaconda来管理包的安装。

    如果是用于学习与研究,而不用与其他人协作或者能够有良好的约定的话,那么可以直接使用conda的默认的环境,这样就可以少安装很多包。

    
    REM 基础包
    
    conda install numpy
    conda install scipy
    conda install pandas
    conda install matplotlib
    
    REM ORM,用于连接数据库
    
    conda install sqlalchemy
    
    
    

    更改Conda的下载镜像

    如果要使用的包并不包含在默认的conda环境中,又想加快下载速度与稳定性的话,可以添加国内的下载镜像。

    在终端中执行以下命令:

    
    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
    
    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
    
    conda config --set show_channel_urls yes
    
    

    参考:

    1. Anaconda 镜像使用帮助

    PIP

    因为某些原因使用Conda可能无法顺利安装一些包,那么可以使用PIP来进行安装。

    
    REM 更新PIP
    
    python -m pip install --upgrade pip
    
    REM 中国股票数据获取
    
    pip install tushare
    
    REM 导出当前环境所有依赖包信息
    
    pip freeze > requirements.txt
    
    REM 根据导出的依赖包信息安装包
    
    pip install -r requirements.txt -d <your_download_dir>
    
    

    常用包推荐

    数据获取&爬虫

    • Tushare:提供便捷的国内股票行情数据的获取(自动爬取相关网站数据)
    • requests:一款优秀的HTTP Request包,可以用于与HTML/XML解析的包结合起来制作爬虫工具。
    • urllib:Python3的内置包,主要用于访问、解析指定URL。
    • Beautiful Soup:一个可以从HTML或XML文件中提取数据的Python库。

    数据整理

    • Numpy:提供强大的矩阵操作,以及一些非常有用的计算工具(如:irr、npv等)
    • Pandas:提供强大的数据框操作(类似R语言中的DataFrame)
    • SciPy:提供强大的统计工具。

    数据可视化

    数据库操作

    • sqlalchemy:数据库建议使用自己熟悉的或项目统一要求的,如:Oracle、MySQL、PostgreSQL、MSSQL、SQLite等。sqlalchemy包可以有效的连接各类常用的数据库,并处理各类操作。
  • 相关阅读:
    spring @component的作用详细介绍
    @Scheduled(cron = "0/5 * * * * *")将时间改为配置
    java项目里classpath具体指哪儿个路径
    返回前多少行数据
    Gson的基本使用
    JSON.toJSONString中序列化空字符串遇到的坑
    指定JSON.toJSONString中实体类属性的输出顺序
    Javascript实现的图片隐写术
    IntelliJ IDEA 快捷键终极大全
    ECMAScript 6 入门
  • 原文地址:https://www.cnblogs.com/sitemanager/p/9075665.html
Copyright © 2011-2022 走看看