zoukankan      html  css  js  c++  java
  • Python数据分析入门(一)——了解Python下的函数包

    1.Numpy:

      Numpy是python科学计算的基础包,它提供以下功能(不限于此):

        (1)快速高效的多维数组对象naarray

        (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数

        (3)用于读写硬盘上基于数组的数据集的工具

        (4)线性代数运算、傅里叶变换,以及随机数生成

        (5)用于将C、C++、Fortran代码集成到python的工具

     

    2.pandas

      pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数。pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据(如SQL)灵活的数据处理能力。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。

      对于金融行业的用户,pandas提供了大量适用于金融数据的高性能时间序列功能和工具。

      DataFrame是pandas的一个对象,它是一个面向列的二维表结构,且含有行标和列标。

      ps.引用一段网上的话说明DataFrame的强大之处:

      Excel 2007及其以后的版本的最大行数是1048576,最大列数是16384,超过这个规模的数据Excel就会弹出个框框“此文本包含多行文本,无法放置在一个工作表中”。Pandas处理上千万的数据是易如反掌的事情,同时随后我们也将看到它比SQL有更强的表达能力,可以做很多复杂的操作,要写的code也更少。 说了一大堆它的好处,要实际感触还得动手码代码。

     

    3.matplotlib

      matplotlib是最流行的用于绘制数据图表的python库。

     

    4.Scipy

      Scipy是一组专门解决科学计算中各种标准问题域的包的集合。
    5.statsmodels: https://github.com/statsmodels/statsmodels
    6.scikit-learn: http://scikit-learn.org/stable/

  • 相关阅读:
    SERV-U处于“域正离线”怎么办?
    在wampserver3.0.6中配置虚拟主机(设置二级域名)
    解决Win7系统新建选项中无记事本问题
    解决Windows Server 2008 R2安装WAMPSERVER3.0.6问题总结
    php实现定时任务的思路
    https配置for apache
    jquery传值
    有趣的em
    自我感觉良好的配搭
    正则基础整理
  • 原文地址:https://www.cnblogs.com/gxt-/p/9313940.html
Copyright © 2011-2022 走看看