zoukankan      html  css  js  c++  java
  • [学习笔记] [数据分析] 01.Python入门

    1、安装Python与环境配置

    ② 安装pip以及利用pip安装Python库

     

    2、Anaconda安装

    conda list 要在root环境下

    3、常用数据分析库

    ① Numpy

    安装:conda install numpy (conda在Anaconda上安装,pip则是在本地上安装)

    提供常用的数值、数组、矩阵函数。

    基于“向量化”的运算,进行数值运算时比list高。

    ② Scipy

    安装:conda install scipy

    是一种使用NumPy来做高等数学、信号处理、优化、统计的扩展包

    ③ Pandas

    安装:conda install pandas

    也是基于Numpy的扩展包,支持CSV文件输入,整合时间序列,进行数据处理。

    重要的数据结构:Series 和 DataFrame

    具体操作:

    显示整个表格所有行:head(),展示表格第一行:head(1)

    展示表格的一些属性:

    表格转秩:

    对表格中某列进行排序:

    ④ Matplotlib

    安装:conda install matplotlib

    seaborn库

    四、常用高级数据分析库

    ①nltk (Natural Language Toolkit)

    pip install -U nltk

    import nltk

    下载预料库:nltk.download()

    应用:文本提取、词汇切分、词频分析、词袋模型、情感分析

    ②igraph

    研究社交网络的数据和图计算

    pip install -U python-igraph

    conda install -c marufr python-igraph=0.7.1.post6

     

    ③ scikit-learn

    机器学习模型的训练 

    是建立在scipy之上的一个用于机器学习的Python模块

    pip install -U scikit-learn

    conda install scikit-learn

    五、Python2和Python3的区别

    Python3的语言更加规范些

    W3School Python 教程

     

  • 相关阅读:
    Nim or not Nim? HDU
    邂逅明下 HDU
    4.1.8 巴什博弈
    4.1.7 Cutting Game(POJ 2311)
    0.1.2 max_element和min_element的用法
    bzoj 2152 聪聪可可 树形dp
    hdu 5976 Detachment 脑洞题 猜结论
    hdu 5974 A Simple Math Problem gcd(x,y)=gcd((x+y),lcm(x,y))
    hdu 5971 Wrestling Match 二分图染色
    Codeforces 842C Ilya And The Tree 树上gcd
  • 原文地址:https://www.cnblogs.com/jaysonguan/p/6935420.html
Copyright © 2011-2022 走看看