zoukankan      html  css  js  c++  java
  • 【Pandas】1.数据读取

    Pandas 1.数据读取

    进行数据分析最麻烦的就是数据获取,然后一旦获得了数据,我们就可以很愉快的开始玩耍这些数据。Pandas的IO tools提供了很多的数据源的类型,但实际上,对于我这个初学者可能用的最多可能就是excel文件了。这里就需要用到pandas.read_excel()函数。

    1.1 pandas.read_excel()

    我们先看下read_excel()的代码:

    pandas.``read_excel(*io*, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, mangle_dupe_cols=True, kwds)**[source]

     

    def read_excel(变量含义
      io, 数据源文件,可以是url、各种文件类型基本都能适用
      sheet_name=0,  
      header=0,  
      names=None,  
      index_col=None,  
      usecols=None,  
      squeeze=False,  
      dtype=None,  
      engine=None,  
      converters=None,  
      true_values=None,  
      false_values=None,  
      skiprows=None,  
      nrows=None,  
      na_values=None,  
      keep_default_na=True,  
      verbose=False,  
      parse_dates=False,  
      date_parser=None,  
      thousands=None,  
      comment=None,  
      skipfooter=0,  
      convert_float=True,  
      mangle_dupe_cols=True,  
      **kwds,  
      ):

    1.2 io

    基本上能想到的各种类型都可以,可以是表示路径的字符串、文件、对象等等。我选择了最容易让我理解的方式,那就是指定路径的方式:

    1 import pandas as pd 
    2  excel_path = '/Users/watalo/Desktop/sz50con.xlsx'
    3  # 默认读取第一张表
    4  df1 = pd.read_excel(excel_path)

    这里我是使用的jupyter notebook,所以创建了一个.ipynb的文件。按下Shift + Enter 得到的结果是默认的“Sheet1”的内容:

  • 相关阅读:
    Linux运维常用的几个命令介绍【转】
    Linux 删除文件后空间不释放【原创】
    使用 Xtrabackup 在线对MySQL做主从复制【转】
    用Centos7搭建小微企业Samba文件共享服务器【转】
    工作流数据表设计
    mysql函数大全
    git 分支管理
    Bootstap datetimepicker报错TypeError: intermediate value
    分分钟搞定IOS远程消息推送
    Windows10下安装OpenSSL
  • 原文地址:https://www.cnblogs.com/watalo/p/13339594.html
Copyright © 2011-2022 走看看