zoukankan      html  css  js  c++  java
  • Python_科学计算平台__pypi体系的numpy、scipy、pandas、matplotlib库简介

    1.numpy——基础,以矩阵为基础的数学计算模块,纯数学

    存储和处理大型矩阵。
    这个是很基础的扩展,其余的扩展都是以此为基础。
    快速学习入口 https://docs.scipy.org/doc/numpy-dev/user/quickstart.html

    2.pandas——数据分析

    基于NumPy 的一种工具,为了解决数据分析任务而创建的。
    Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
    最具有统计意味的工具包,某些方面优于R软件。
    数据结构有一维的Series,二维的DataFrame(类似于Excel或者SQL中的表,如果深入学习,会发现Pandas和SQL相似的地方很多,例如merge函数),
    三维的Panel
    (Pan(el) + da(ta) + s,知道名字的由来了吧)。
    学习pandas要掌握:
    汇总和计算描述统计,处理缺失数据 ,层次化索引
    清理、转换、合并、重塑、GroupBy技术
    日期和时间数据类型及工具(日期处理方便地飞起)。
    http://pandas.pydata.org/pandas-docs/stable/10min.html

    3.matplotlib——绘图,不推荐使用,不如用seaborn

    python中最著名的绘图系统.很多其他的绘图例如seaborn(针对pandas绘图而来)也是由其封装而成。
    这个绘图系统操作起来很复杂,和R的ggplot,lattice绘图相比显得望而却步,这也是为什么我个人不丢弃R的原因.
    但是matplotlib的复杂给其带来了很强的定制性。其具有面向对象的方式及Pyplot的经典高层封装。
    需要掌握的是:
    散点图,折线图,条形图,直方图,饼状图,箱形图的绘制。
    绘图的三大系统:pyplot,pylab(不推荐),面向对象
    坐标轴的调整,添加文字注释,区域填充,及特殊图形patches的使用
    金融的同学注意的是:可以直接调用Yahoo财经数据绘图.
    http://matplotlib.org/users/pyplot_tutorial.html

    4.scipy——数值计算库

    在NumPy库的基础上增加了众多的数学、科学以及工程计算中常用的库函数。
    方便、易于使用、专为科学和工程设计的Python工具包.
    它包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等。

    5.Python numpy,scipy,pandas这些库的区别

    Numpy是以矩阵为基础的数学计算模块,纯数学。
    Scipy基于Numpy,科学计算库,有一些高阶抽象和物理模型。比方说做个傅立叶变换,这是纯数学的,用Numpy;做个滤波器,这属于信号处理模型了,在Scipy里找。
    Pandas提供了一套名为DataFrame的数据结构,比较契合统计分析中的表结构,并且提供了计算接口,可用Numpy或其它方式进行计算。

  • 相关阅读:
    31天重构学习笔记21. 合并继承
    31天重构学习笔记15. 移除重复内容
    31天重构学习笔记22. 分解方法
    31天重构学习笔记18. 使用条件判断代替异常
    31天重构学习笔记19. 提取工厂类
    31天重构学习笔记24. 分解复杂判断
    31天重构学习笔记17. 提取父类
    大型项目的发布部署:第一章:发布部署流程
    HDU 2036 改革春风吹满地 数学题
    HDU 2051 Bitset
  • 原文地址:https://www.cnblogs.com/hellangels333/p/9052133.html
Copyright © 2011-2022 走看看