zoukankan      html  css  js  c++  java
  • pandas模块

    pandas模块

    pandas官方文档:https://pandas.pydata.org/pandas-docs/stable/?v=20190307135750

    pandas基于Numpy,可以看成是处理文本或者表格数据。pandas中有两个主要的数据结构,其中Series数据结构类似于Numpy中的一维数组,DataFrame类似于多维表格数据结构。

    pandas是python数据分析的核心模块。它主要提供了五大功能:

    1. 支持文件存取操作,支持数据库(sql)、html、json、pickle、csv(txt、excel)、sas、stata、hdf等。
    2. 支持增删改查、切片、高阶函数、分组聚合等单表操作,以及和dict、list的互相转换。
    3. 支持多表拼接合并操作。
    4. 支持简单的绘图操作。
    5. 支持简单的统计分析操作。

    一、Series数据结构

    Series是一种类似于一维数组的对象,由一组数据和一组与之相关的数据标签(索引)组成。

    Series比较像列表(数组)和字典的结合体

    import numpy as np
    import pandas as pd
    df = pd.Series(0, index=['a', 'b', 'c', 'd'])
    print(df)
    

    a 0
    b 0
    c 0
    d 0
    dtype: int64

    print(df.values)
    print(df.index)
    

    [0 0 0 0]

    ndex(['a', 'b', 'c', 'd'], dtype='object')

    1.1Series支持NumPy模块的特性(下标)

    详解 方法
    从ndarray创建Series Series(arr)
    与标量运算 df*2
    两个Series运算 df1+df2
    索引 df[0], df[[1,2,4]]
    切片 df[0:2]
    通用函数 np.abs(df)
    布尔值过滤 df[df>0]
  • 相关阅读:
    expdp使用
    sed命令(二)
    linux的sed命令(一)
    weblogic找不到数据源
    windows 常用操作
    Spring in action (1)
    Eclipse使用
    maven
    Maven-01 安装maven
    Java开发环境搭建
  • 原文地址:https://www.cnblogs.com/dadazunzhe/p/11403984.html
Copyright © 2011-2022 走看看