zoukankan      html  css  js  c++  java
  • Python数据分析软件包介绍

    Python数据分析主要软件包:

    1、python -m pip install numpy

    2、python -m pip install pandas

    3、python -m pip install matplotlib

    4、python -m pip install scipy

    5、python -m pip install wordcloud

    6、python -m pip install scikit-learn

    软件包功能介绍:

    1、Numpy

    Numpy提供了两种基本的对象:ndarray和ufunc。ndarray是存储单一数据类型的多维数组,而ufunc是能够对数组进行处理的函数。Numpy的功能:N维数组,一种快速、高效使用内存的多维数组,他提供矢量化数学运算;可以不需要使用循环,就能对整个数组内的数据进行标准数学运算。 非常便于传送数据到用低级语言编写(CC++)的外部库,也便于外部库以Numpy数组形式返回数据。Numpy不提供高级数据分析功能,但可以更加深刻的理解Numpy数组和面向数组的计算。

    2、Pandas

    Pandas是Python的一个数据分析包,Pandas最初被用作金融数据分析工具而开发出来,Pandas纳入了大量的库和一些标准的数据模型以及函数和方法。提供了高效的操作大型数据集所需要的工具。Pandas建立在Numpy之上,使得Numpy应用变得简单。带有坐标轴的数据结构,支持自动或明确的数据对齐(这能防止由于数据结构没有对齐,以及处理不同来源、采用不同索引的数据而产生的常见错误)。使用Pandas更容易处理丢失数据),合并流行数据库(如:基于SQL的数据库)。

    3、Matplotlib

    Matplotlib是Python的一个可视化模块,同时是基于Numpy的一套Python包,他能方便的只做线条图、饼图、柱状图以及其他专业图形。使用Matplotlib,可以定制所做图表的任一方面,可以控制Matplotlib中的每一个默认属性:图像大小、每英寸点数、线宽、色彩和样式、子图、坐标轴、网格属性、文字和文字属性。它支持所有操作系统下不同的GUI后端,并且可以将图形输出为常见的矢量图和图形测试,如PDF SVG JPG PNG BMP GIF.通过数据绘图,我们可以将枯燥的数字转化成人们容易接收的图表。

    4、Scipy

    Scipy是一款方便、易于使用、专门为科学和工程设计的Python包,它包括统计、优化、整合、线性代数模块、傅里叶变换、信号和图像处理、常微分方程求解器等。Scipy依赖于Numpy,并提供许多对用户友好的和有效的数值例程,如数值积分和优化。

    Python有着像Matlab一样强大的数值计算工具包Numpy;有着绘图工具包Matplotlib;有着科学计算工具包Scipy。

    5、Scikit-Learn

    Scikit-Learn是基于Python机器学习的模块,基于BSD开源许可证;它的安装需要Numpy Scipy Matplotlib等模块。Scikit-Learn的主要功能有:分类、回归、聚类、数据降维、模型选择、数据预处理。

    Scikit-Learn有一些经典的库:

    (1)Nltk,用于自然语言处理;

    (2)Scrappy,用于网站数据抓取;

    (3)Pattern,用于网络挖掘;

    (4)Theano,用于深度学习。

    Scikit-Learn自带一些经典的数据集:用于分类的iris和digits数据集,还有用于回归分析的boston house prices数据集。该数据集是一种字典结构,数据存储在.data成员中,输出标签存储在.target成员中。

    Scikit-Learn建立在Scipy之上,提供了一套常用的机器学习算法,通过一个统一的接口来使用,Scikit-Learn有助于在数据集上实现流行的算法。

    Python能直接处理数据,而Pandas几乎可以像SQL那样对数据进行控制。Matplotlib能够对数据进行可视化,快速理解数据。Scikit-Learn提供了机器学习算法的支持,Theano提供了深度学习框架(还可以使用CPU加速)。

  • 相关阅读:
    C#
    C#
    ssh学习笔记
    (已解决)Could not open '/var/lib/nova/mnt/*/volume-*': Permission denied
    RPCVersionCapError: Requested message version, 4.17 is incompatible. It needs to be equal in major version and less than or equal in minor version as the specified version cap 4.11.
    如何在linux下安装idea
    The system has no LUN copy license
    调整mysql数据库最大连接数
    mysql数据库编码问题
    cinder支持nfs快照
  • 原文地址:https://www.cnblogs.com/hhh188764/p/13052125.html
Copyright © 2011-2022 走看看