zoukankan      html  css  js  c++  java
  • Pandas 数据读取

    1.读取table

    # 读取普通分隔数据:read_table
    # 可以读取txt,csv
    
    import os
    os.chdir('F:/')   #首先设置一下读取的路径
    
    data1 = pd.read_table('data1.txt', delimiter=',',header = 0)
    print(data1)
    data1 = pd.read_table('data1.txt', delimiter=',',header = 0, index_col=1) #index_col = 1把var2那列作为索引
    print(data1)
    # delimiter:用于拆分的字符,也可以用sep:sep = ','
    # header:用做列名的序号,默认为0(第一行) header = 0 默认把第一行当作列来做参考
    # index_col:指定某列为行索引,否则自动索引0, 1, .....  不指定就没有
    
    # read_table主要用于读取简单的数据,txt/csv

    输出结果:

       va1  va2  va3  va4
    0    1    2    3    4
    1    2    3    4    5
    2    3    4    5    6
    3    4    5    6    7
         va1  va3  va4
    va2               
    2      1    3    4
    3      2    4    5
    4      3    5    6
    5      4    6    7

    2.读取csv数据

    # 读取csv数据:read_csv
    # 先熟悉一下excel怎么导出csv
    
    data2 = pd.read_csv('data2.csv',encoding = 'utf-8')
    print(data2.head())
    # encoding:指定字符集类型,即编码,通常指定为'utf-8'
    
    # 大多数情况先将excel导出csv(excel另存为csv格式),再读取

    3.读取excel数据

    # 读取excel数据:read_excel
    
    data3 = pd.read_excel('数据库.xlsx',sheet_name='数据库',header=0)
    print(data3.head())
    # io :文件路径。
    # sheetname:返回多表使用sheetname=[0,1],若sheetname=None是返回全表 → ① int/string 返回的是dataframe ②而none和list返回的是dict
    #sheetname可以写表本身的名称,也可以写0,1,2指的是读取这个excel里面哪一页的表
    # header:指定列名行,默认0,即取第一行
    # index_col:指定列为索引列,也可以使用u”strings”
  • 相关阅读:
    HDU-5534-Partial Tree
    Dire Wolf HDU
    HDU 5119 Happy Matt Friends (14北京区域赛 类背包dp)
    4 Values whose Sum is 0 POJ
    Fliptile POJ
    Face The Right Way POJ
    【Selenium学习】解决chromedriver.exe' executable needs to be in PATH
    【Jenkins学习】修改jenkins显示为中文语言
    【Jenkins学习】Jenkins 批量删除历史构建
    【Tomcat学习】tomcat 日志详解
  • 原文地址:https://www.cnblogs.com/carlber/p/9926133.html
Copyright © 2011-2022 走看看