zoukankan      html  css  js  c++  java
  • 数据分析常用工具

    NumPy
    NumPy(Numerical Python的简称)是Python科学计算的基础包。在本专题中的大部分内容都是基于NumPy以及构建于其上的库,它提供了以下功能(不限于此):
    - 快速高效的多位数组对象ndarray
    - 用于对数组执行元素级计算以及直接对数组执行数学运算的函数
    - 用于读写硬盘上的基于数组的数据集工具
    - 线性代数计算、傅里叶变换以及随机数生成
    - 用于将C、C++、Fortran代码集成到Python工具中
    除了Python提供快速的数组处理能力,NumPy在数据分析方面还有另外一个主要作用,即作为在算法之间传递数据的容器。对于数值型数据,NumPy数组在存储和处理数据时要比内置的Python数据结构高效得多。此外,由低级语言(比如C和Fortran)编写的库可以直接操作NumPy数组中的数据,无需进行任何数据复制工作。

    pandas
    Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。


    matplotlib

    Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形 。通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。

    SciPy

    SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包.它包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等

    类库安装

    pip install NumPy 
    pip install pandas 
    pip install matplotlib 
    pip install SciPy

    一起记录学习
  • 相关阅读:
    spark streaming 入门例子
    ElasticSearch-hadoop saveToEs源码分析
    spark 资源参数调优
    spark 任务运行原理
    spark RDD底层原理
    用实例说明Spark stage划分原理
    Spark任务提交底层原理
    spark shuffle内在原理说明
    iOS 辛格尔顿
    CodeForces 22D Segments 排序水问题
  • 原文地址:https://www.cnblogs.com/yjz8888/p/9910418.html
Copyright © 2011-2022 走看看