zoukankan      html  css  js  c++  java
  • Pandas处理数据常用方法

    # -*- coding: utf-8 -*-
    import pandas as pd
    """
    (1)利用pandas读取csv文件
    """
    def readcsv(path):
    df=pd.read_csv(path,sep=',')
    print("1 打印索引:",df.index)
    print("2 前五行",df[0:5])
    print("3 只选择第五行",df.loc[5])
    print("4 选择第5行和第七行",df.loc[[5,7]])
    print("5 把身高作为该DataFrame的索引:",df.set_index('shengao',inplace=False,drop=True))
    print("6 查看各行的数据格式:",df.dtypes)
    print("7 查看列名:",df.columns)
    print("8 查看数据值:",df.values)
    list=df.values
    print("9 数据的行数为:",len(list))
    print("10 描述性统计:",df.describe)
    print("11 转置为:",df.T)
    #print("按列名排序",df.sort(columns='shengao'))
    #使用DataFrame选择数据:
    print("12 显示列名下的数据为:",df['shengao'])
    #使用DataFrame筛选数据:
    alist=[1.7]
    r1=df['shengao'].isin(alist) #将要过滤的数据放入字典中,使用isin对数据进行筛选,返回行索引以及每行筛选的结果,若匹配则返回ture
    print("13 结果为:",r1)
    index1=df[df['shengao'].isin(alist)]#获取匹配结果为ture的行
    print("14 索引值为:",index1)
    print("15 统计:",df.sum().values)
    print("16 统计:",df.cumsum().values)
    print("17 最大值对应的索引:",df.idxmax())
    df.insert(2,'s',2)
    print("插入一列的结果",df.describe)
    #在字典中获得数据http://scikit-learn.org/stable/modules/feature_extraction.html#feature-extraction

    if __name__ == '__main__':
    pathroad='E:/TestData/testdata/kehu.csv'
    readcsv(pathroad)

  • 相关阅读:
    hdu 1032 水题也wrong 两次(于是乎更有刷水题的必要了)
    淘宝刷钻员
    hdu 4006 求第K大的数 优先队列
    骗子满天飞
    hdu 2115 :I Love This Game(Presentation Error容易输出wrong)
    hdu 1048 (map的使用)
    hdu 1722 数论题
    hdu 1237 简单计算器
    Android编码规范
    xamarin开发实例(一) android PC 基于Tcp双向通信
  • 原文地址:https://www.cnblogs.com/wangleBlogs/p/7280421.html
Copyright © 2011-2022 走看看