zoukankan      html  css  js  c++  java
  • Pandas 基础(3)

    这一节想总结一下 生成 Dataframe 的几种方式:

    1. CSV
    2. Excel
    3. python dictionary
    4. List of tuples
    5. List of dictionary

    下面分别一一介绍具体的实现方式:

    • 通过 csv 文件
      这里补充一个知识点, 就是如果要读取的文件不在 jupyter 所在的文件夹, 则可以通过绝对路径的方式引入.
    df = pd.read_csv("/Users/rachel/Downloads/weather.csv")
    
    • 通过 Excel 文件
      这里的第二个参数是必填项, 因为要指明具体读取 excel 表中的哪个 sheet.
    df = pd.read_excel("/Users/rachel/Downloads/weather.xlsx", "weather")
    

    还有一个小坑, 就是在初次运行的时候有可能会提示错误, 根据错误提示, 大概可以了解到, 要读取 excel 文件, 还需要一个 xlrd 的包, 在终端运行下面命令就好了

    pip3 install xlrd
    
    • 通过 python dictionary (为了方便大家日后可以更好地理解英文文档, 这里的一些专业名词, 我就都不翻译了)
    weather_data = {
        'day': ['1/1/2017','1/2/2017','1/3/2017'],
        'temperature': [32,35,28],
        'windspeed': [6,7,2],
        'event': ['Rain', 'Sunny', 'Snow']
    }
    df = pd.DataFrame(weather_data)
    
    • 通过 List of tuples
    weather_data = [
        ('1/1/2017',32,6,'Rain'),
        ('1/2/2017',35,7,'Sunny'),
        ('1/3/2017',28,2,'Snow')
    ]
    df = pd.DataFrame(data=weather_data, columns=['day','temperature','windspeed','event'])
    

    上面例子中, weather_data 的数据结构是一个 list(特点是中括号), list 中的每一个元素就是一个 tuple, 由于原数据没有指明列名, 所以在创建 dataframe 的时候, 需要指明列名.

    • 通过 List of dictionary, 从名字就可以读出来下面的数据结构是一个 list, list 中的每个元素又是一个 dictionary.
    weather_data = [
        {'day': '1/1/2017', 'temperature': 32, 'windspeed': 6, 'event': 'Rain'},
        {'day': '1/2/2017', 'temperature': 35, 'windspeed': 7, 'event': 'Sunny'},
        {'day': '1/3/2017', 'temperature': 28, 'windspeed': 2, 'event': 'Snow'},
        
    ]
    df = pd.DataFrame(data=weather_data, columns=['day','temperature','windspeed','event'])
    

    上面简要介绍了 5 中生成 dataframe 的方式, 其实 Pandas 还支持很多种文件格式的输入输出, 具体可以参考下官方文档 https://pandas.pydata.org/pandas-docs/version/0.22/io.html

    有任何问题或意见, 欢迎留言交流哦~~~

  • 相关阅读:
    TS流批量下载----------Xamarin开发系列
    TS视频流下载合成
    B站缓存视频音频合并
    ActiveX录音插件
    FZU-2191 完美的数字 简单数论
    COCI2011/2012 破解密文 KMP
    COCI2010/2011 踢踏舞 线段树区间子段和
    [USACO03FALL] 受欢迎的牛-G tarjan缩点
    洛谷 P1967 货车运输 最大生成树+倍增LCA
    洛谷 P1613 跑路 倍增+最短路
  • 原文地址:https://www.cnblogs.com/rachelross/p/10405841.html
Copyright © 2011-2022 走看看