zoukankan      html  css  js  c++  java
  • python-数据处理的包Numpy,scipy,pandas,matplotlib

    一,NumPy包(numeric python,数值计算)

    该包主要包含了存储单一数据类型的ndarry对象的多维数组和处理数组能力的函数ufunc对象。是其它包数据类型的基础。只能处理简单的数据分析能力,对于高级的数据处理和大数据分析,采用pandas包。

    python自带的list可以包含不同类型的数据,原因是list保存的实际是这些数据的指针,这样才能实现不同类型的数据都能保存在list中。但缺点是这样的保存方式消耗内存,运行工作量大。

    二,Scipy包(scientific python,科学计算)

    主要用于数据处理,包括统计分析,优化,整合,线性代数,傅里叶变换,信号处理,图像处理,常微分方程求解等,依赖与Numpy包,因为numpy是该包数据类型来源。

    三,Pandas包

    主要用于数据清洗,整理,建立在numpy上。

    擅长处理大数据(文本,csv,excel等数据)。数据也来自与numpy类型数据,因此依赖numpy包

    四,matplotlib包

    matplotlib也是基于numpy的包,主要负责数据的可视化显示。

    五,scikit-learn包

    机器学习,建立在scipy基础上

    基本功能被分为六个部分,分类,回归,聚类,数据降维,数据选择,数据预处理

    六,Nltk包

    自然语言处理

    七,Pattern包

    网络挖掘

    八,Theano包

    深度学习

    九,Scrappy包

    网络爬虫

    参考文献:z00182 python与数据科学

  • 相关阅读:
    使 Asp.net Core Hosting Bundle 立即生效
    Hosted Services require keep alive
    VS 高级保存选项,解决文件内容编码问题
    asp.net core localhost https 证书
    阿里云K8S下玩.NET CORE 3.1
    cmd 域名生效检测
    c# 通过win32 api 得到指定Console application Content
    .net framework msbuild环境搭建 (不装vs)
    Python常用模块——目录
    Python——爬虫进阶
  • 原文地址:https://www.cnblogs.com/zhuluqing/p/9746998.html
Copyright © 2011-2022 走看看