zoukankan      html  css  js  c++  java
  • Pandas数据存取

    
    
    pd.read_excel('foo.xlsx', 'Sheet1', index_col=None, na_values=['NA'])
    
    
    
    Pandas数据存取
    Pandas可以存取多种介质类型数据,例如:内存、文本、CSV、JSON、HTML、Excel、HDF5、SQL等
    
    生成数据
    
    import numpy as np
    import pandas as pd
    
    df = pd.DataFrame(np.random.randn(1000, 4),columns=['A', 'B', 'C', 'D'])
    
    df

    Pandas存取CSV

    写入CSV

    df.to_csv('foo.csv')
    
    df.to_csv('foo.csv',index=False) #不保存行索引

    读取CSV

    pd.read_csv('foo.csv')

    读取CSV其他参数

    pd.read_csv(
        'aaa.csv', #文件名
        usecols=[0,1,2,4], #读取指定列
        nrows=10, #读取前几行
        encoding='GBK' #编码,根据文本编码修改,默认utf-8,可以指定为GBK
    )
    
    
    '''
    data,time,name,age
    20100101,000000,"张三",18
    20100101,230000,"李,四",28
    '''
    
    x = pd.read_csv(
        'aaa.csv',
        parse_dates={'timestamp': ['data','time']}, #将两列合并解析为时间格式
        index_col='timestamp' #将时间设为行索引
    )
    • csv文件内有汉字等特殊符号时,csv文件编码应为utf-8(无BOM)可默认正常读取,如果编码是ANSI,加参数encoding='GBK'
    • 数据内有逗号时,左右加英文半角双引号,可以正常解析

    Pandas存取HDF5

    写入HDF5

    df.to_hdf('foo.h5','df')

    从HDF5读取

    pd.read_hdf('foo.h5','df')

    Pandas存取Excel(xlsx)

    写入Excel文件

    df.to_excel('foo.xlsx', sheet_name='Sheet1')

    从Excel文件读取

    
    
  • 相关阅读:
    使用一个Python脚本来运行一个简单的Django项目
    创建第一个Django项目
    Windows下安装Python3和Django
    node.js使用node-xlsx读写数据
    U盘分区后合并
    linux命令学习-3-sysctl
    linux命令学习-2-dmesg
    linux命令学习-1-less
    在服务器上排除问题的头五分钟
    c++读取REG_MULTI_SZ类型注册表
  • 原文地址:https://www.cnblogs.com/yoyo1216/p/10131770.html
Copyright © 2011-2022 走看看