zoukankan      html  css  js  c++  java
  • Pandas处理数据常用方法

    # -*- coding: utf-8 -*-
    import pandas as pd
    """
    (1)利用pandas读取csv文件
    """
    def readcsv(path):
    df=pd.read_csv(path,sep=',')
    print("1 打印索引:",df.index)
    print("2 前五行",df[0:5])
    print("3 只选择第五行",df.loc[5])
    print("4 选择第5行和第七行",df.loc[[5,7]])
    print("5 把身高作为该DataFrame的索引:",df.set_index('shengao',inplace=False,drop=True))
    print("6 查看各行的数据格式:",df.dtypes)
    print("7 查看列名:",df.columns)
    print("8 查看数据值:",df.values)
    list=df.values
    print("9 数据的行数为:",len(list))
    print("10 描述性统计:",df.describe)
    print("11 转置为:",df.T)
    #print("按列名排序",df.sort(columns='shengao'))
    #使用DataFrame选择数据:
    print("12 显示列名下的数据为:",df['shengao'])
    #使用DataFrame筛选数据:
    alist=[1.7]
    r1=df['shengao'].isin(alist) #将要过滤的数据放入字典中,使用isin对数据进行筛选,返回行索引以及每行筛选的结果,若匹配则返回ture
    print("13 结果为:",r1)
    index1=df[df['shengao'].isin(alist)]#获取匹配结果为ture的行
    print("14 索引值为:",index1)
    print("15 统计:",df.sum().values)
    print("16 统计:",df.cumsum().values)
    print("17 最大值对应的索引:",df.idxmax())
    df.insert(2,'s',2)
    print("插入一列的结果",df.describe)
    #在字典中获得数据http://scikit-learn.org/stable/modules/feature_extraction.html#feature-extraction

    if __name__ == '__main__':
    pathroad='E:/TestData/testdata/kehu.csv'
    readcsv(pathroad)

  • 相关阅读:
    【luogu2756】 飞行员配对方案问题 [二分图匹配 匈牙利算法]
    [APIO2008]紧急集合
    2019.8.27 Za
    【luogu2763】试题库问题 [网络流 最大流]
    [CQOI2014]危桥 [网络流 最大流]
    【luogu1231】教辅的组成 [网络流 最大流]
    【网络流】
    【2019.8.24】
    【匈牙利算法】
    2019.8.23 Za [数论]
  • 原文地址:https://www.cnblogs.com/wangleBlogs/p/7280421.html
Copyright © 2011-2022 走看看