zoukankan      html  css  js  c++  java
  • 2018.03.29 python-pandas 数据读取

    #数据读取
    # read_table,read_csv,read_excel

     1 #读取普通分隔数据:read_table
     2 #可以读取txt,csv
     3 import os
     4 import pandas as pd
     5 os.chdir(r'C:UsersBRIGHT-SH-002Desktoppython')
     6 
     7 
     8 data1 = pd.read_table('data1.csv',delimiter=',',header=0)
     9 print(data1)
    10 data1 = pd.read_table('data1.csv',delimiter=',',header=0,index_col=0)
    11 print(data1)
    12 #delimiter:用于拆分的字符,也可以用sep:sep=','
    13 #header:用做列名的序号,默认为0(第一行)
    14 #index_col:指定将某烈为行索引,否则自动索引0,1 (作为索引列)
    15 
    16 #read_table主要用于读取简单的数据 txt/csv

    结果:

       va1  va2  va3  va4
    0    1    2    3    4
    1    2    3    4    5
    2    3    4    5    6
    3    4    5    6    7
         va2  va3  va4
    va1              
    1      2    3    4
    2      3    4    5
    3      4    5    6
    4      5    6    7 

    1 # 读取csv数据:read_csv
    2 # 先熟悉一下excel怎么导出csv
    3 data2 = pd.read_csv('data2.csv',engine='python')
    4 print(data2.head())
    5 #engine:使用的分析引擎,可以选择C或者python。 C引擎快但是python引擎更加完备
    6 #encoding:指定字符集类型,即编码,通常指定'utf-8'
    7 print(type(data2))
    8 #大多数情况先将excel导出csv,再读取
    #读取excel数据:read_excel
    data3 = pd.read_excel('test.xlsx',sheet_name='test1',header=0)
    print(data3.head())
    #io:文件路径
    #sheet_name:返回多个表用sheet_name=[0,1],若sheet_name=None是返回全表 
                                        #-> 1.int/string 返回的是dataframe 2.而None和list返回的是dict
    #header:指定列名行,默认0,取第一行
    #index_col:指定列为索引列,也可以使用:'strings'
  • 相关阅读:
    Poj3295 tautology
    Poj2586 每五个月都是亏
    Poj 2109 k^n = p.
    Poj2109 (2) k^n = p.
    Poj2109 (1) k^n = p.
    Poj2965 冰箱的开关
    Poj1328 用雷达覆盖所有的岛屿
    FASTER-RCNN
    卷积、池化计算
    理论感受野的计算
  • 原文地址:https://www.cnblogs.com/jxzhu/p/8670657.html
Copyright © 2011-2022 走看看