zoukankan      html  css  js  c++  java
  • pandas.read_csv() 部分参数解释

    read_csv()所有参数

    pandas.read_csv(     
      filepath_or_buffer,     
      sep=',',     
      delimiter=None,     
      header='infer',     
      names=None,     
      index_col=None,     
      usecols=None,     
      squeeze=False,     
      prefix=None,     
      mangle_dupe_cols=True,     
      dtype=None,     
      engine=None,     
      converters=None,     
      true_values=None,     
      false_values=None,     
      skipinitialspace=False,     
      skiprows=None,     
      nrows=None,     
      na_values=None,     
      keep_default_na=True,     
      na_filter=True,     
      verbose=False,     
      skip_blank_lines=True,     
      parse_dates=False,     
      infer_datetime_format=False,     
      keep_date_col=False,     
      date_parser=None,     
      dayfirst=False,     
      iterator=False,     
      chunksize=None,     
      compression='infer',     
      thousands=None,     
      decimal=b'.',     
      lineterminator=None,     
      quotechar='"',     
      quoting=0,     
      escapechar=None,     
      comment=None,     
      encoding=None,     
      dialect=None,     
      tupleize_cols=None,     
      error_bad_lines=True,     
      warn_bad_lines=True,       
      skipfooter=0,     
      doublequote=True,     
      delim_whitespace=False,     
      low_memory=True,     
      memory_map=False,     
      float_precision=None

    参数用法

    sep=','   # 以 “,” 作为数据的分隔符
    shkiprows= 10   # 跳过前十行
    usecols=['column1', 'column2', 'column3'] # 读取指定列
    nrows = 10 # 只取前10行 chunksize=1000 # 分块大小来读取文件(每次读取多少行),不一次性把文件数据读入内存中,而是分多次
    parse_dates = ['col_name'] # 指定某行读取为日期格式 index_col = ['col_1','col_2'] # 读取指定的几列 error_bad_lines = False # 当某行数据有问题时,不报错,直接跳过,处理脏数据时使用 na_values = 'NULL' # 将NULL识别为空值

    (后续补充)

      

  • 相关阅读:
    git撤销操作总结
    pull request的一些思考
    设计模式之门面模式
    设计模式之策略模式
    java中的堆栈
    git冲突的处理
    Eclipse 未正常退出,导致进不去的问题
    think in java读后总结---Map集合的几种遍历方式
    maven打包后项目名称不对
    python之正则表达式
  • 原文地址:https://www.cnblogs.com/bigtreei/p/10521436.html
Copyright © 2011-2022 走看看