zoukankan      html  css  js  c++  java
  • Python 数据处理扩展包: numpy 和 pandas 模块介绍

    一、numpy模块

      NumPy(Numeric Python)模块是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。据说NumPy将Python相当于变成一种免费的更强大的MatLab系统。

      NumPy模块提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库等。

      1)、一个强大的N维数组对象Array;

      2)、比较成熟的(广播)函数库;

      3)、用于整合C/C++和Fortran代码的工具包;

      4)、实用的线性代数、傅里叶变换和随机数生成函数。

    二、pandas模块

      Pandas(Python Data Analysis Library )是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

      Pandas中的数据结构有如下几种:

      1、Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近,其区别是:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。
     
      2、Time- Series:以时间为索引的Series。
     
      3、DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。
     
      4、Panel :三维的数组,可以理解为DataFrame的容器。
     
    三、Linux下 pandas 的安装
    在linux下,安装pandas的方式是:
    sudo apt-get install python-pandas
     
    需要注意的是, 使用 sudo pip install pandas 会报错,可能是依赖的问题。
    但使用apt-get install的方式却可以成功安装。
     

      

  • 相关阅读:
    基于jquery的弹幕实现
    Cookie在顶级域名、二级域名和三级域名之间共享的情况
    报错:Win10 这台计算机中已经安装了 .NET Framework 4.5.2/4.6.1/4.7.1等等任何版本 或版本更高的更新
    Unity中的Text内容有空格导致换行
    逆波兰表达式
    Java基础03 byte[] 与 16进制字符串之间的转换
    nacos Linux 单机模式配置
    Oracle 常用SQL
    软件安装01 Linux下redis安装
    Java基础04 JSONObject 与范型对象转换
  • 原文地址:https://www.cnblogs.com/51kata/p/5406180.html
Copyright © 2011-2022 走看看