zoukankan      html  css  js  c++  java
  • 利用python进行数据分析

    这本书看完,重点分为以下几大点:

    1.Numpy包

    这书数据分析的基础包,其中核心的我认为是ndarray,也就是一种多维数组对象;

    这种数组里面还有索引和切片的概念,也很重要;

    除此之外,计算多维数组还对应着许多通用函数,有些常用的函数,我们要记住且会使;

    2.Pandas库

    这个库在数据分析中是十分重要的,其中Series和DataFrame两种数据结构尤为重要;

    本库中还有一些十分重要的基本功能,包括各种索引选取过滤,处理缺失数据,汇总和计算统计描述等;

    3.绘图和可视化

    本节最重要的就是掌握 matplotlib 工具的使用,

    利用此工具可以画出各种样式的图形,如柱状图、直方图、密度图、散布图等;

    4.时间序列

    本节最重要的几个概念:时间戳(timestamp)、固定时期(period)、时间间隔(interval);

    5.数据加载、存储和文件格式

    本节主要讲各种格式的数据如何读取和存储,包括文本格式、JSON、二进制数据格式;

    6.数据清理、转换、合并和重塑

    本节主要讲数据的规整化,包括数据集的合并:索引合并、重叠数据合并;

    然后是数据转换和字符串操作;

    7.数据聚合与分组运算

    本节主要讲了利用pandas库中十分重要的函数-----groupby,它能使你以一种自然的方式对数据集进行切片、切块、摘要等操作;

    本节主要掌握:
    ①根据一个或多个键拆分pandas对象

    ②计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数

    ③对DataFrame的列应用各种各样的函数

    ④应用组内转换或其他运算,如规格化、线性回归、排名或选取子集

    ⑤计算透视表或交叉表

    ⑥执行分位数分析以及其他分组分析

  • 相关阅读:
    OpenCascade Ray Tracing Rendering
    Create New Commands in Tcl
    OpenCascade Modeling Algorithms Fillets and Chamfers
    OpenCascade Modeling Algorithms Boolean Operations
    Construction of Primitives in Open Cascade
    Open Cascade Data Exchange STL
    Tcl Tk Introduction
    Open Cascade DataExchange IGES
    Netgen mesh library : nglib
    Hello Netgen
  • 原文地址:https://www.cnblogs.com/zhzJAVA11/p/10623010.html
Copyright © 2011-2022 走看看