zoukankan      html  css  js  c++  java
  • pandas之DataFrame

    DataFrame 类型类似于数据库表结构的数据结构,其含有行索引和列索引,可以将DataFrame 想成是由相同索引的Series组成的Dict类型。在其底层是通过二维以及一维的数据块实现.

    1,DataFrame 对象的构建

    import pandas as pd
    #声明数据框架对象
    list = {'男生':['王超','德芙','家福'],'女生':['阿尼','阿玉','阿东']}
    gendered = pd.DataFrame(list)
    print(gendered)
    #自动生成索引
    结果:
       男生  女生
    0  王超  阿尼
    1  德芙  阿玉
    2  家福  阿东
    2指定列的顺序
    gendered1 = pd.DataFrame(list,columns=['女生','男生'])
    print(gendered1)
    结果:
       女生  男生
    0  阿尼  王超
    1  阿玉  德芙
    2  阿东  家福
    3指定索引
    gendered2 = pd.DataFrame(list,[7,8,9])
    print(gendered2)
    
    结果:
       男生  女生
    7  王超  阿尼
    8  德芙  阿玉
    9  家福  阿东

    一些常用属性

    list = {'男生':['王超','德芙','家福'],'女生':['阿尼','阿玉','阿东']}
    df = pd.DataFrame(list)
    
    print(df.size)
    print(df.shape)
     #打印头部一条
    print(df.head(1))
    # 打印尾部一条
    print(df.tail(1))
    # 打印所有列
    print(df.columns)
    # 打印数据
    print(df.info())
    
    结果:
    6
    
    (3, 2)
      
      男生  女生
    0  王超  阿尼
     
      男生  女生
    2  家福  阿东
    
    Index(['男生', '女生'], dtype='object')
    
    <class 'pandas.core.frame.DataFrame'>
    RangeIndex: 3 entries, 0 to 2
    Data columns (total 2 columns):
    男生    3 non-null object
    女生    3 non-null object
    dtypes: object(2)
    memory usage: 128.0+ bytes

    实例 应用:

    #使用科学计算来统计AVG年龄
    df = pd.DataFrame({'gender':['',''],'age':[18,20]})
    #分组运算
    grouped = df['age'].groupby(df['gender'])
    #平均年龄
    avg_age = grouped.mean()
    #可以根据键取值
    print(avg_age)
    
    结果:
    gender
    女    2018
    Name: age, dtype: int64
  • 相关阅读:
    Jquery-EasyUI学习2~
    IIS——发布网站
    一致性哈希算法
    利用ZTree链接数据库实现 [权限管理]
    Form表单提交的简要方式
    Redis学习之5种数据类型操作、实现原理及应用场景
    redis对比其余数据库
    ZooKeeper概述(转)
    Zookeeper-Zookeeper可以干什么
    Java内存分配及变量存储位置实例讲解
  • 原文地址:https://www.cnblogs.com/xcsg/p/10469506.html
Copyright © 2011-2022 走看看