zoukankan      html  css  js  c++  java
  • Python Pandas库的学习(一)

    今天我们来学习一下Pandas库,前面我们讲了Numpy库的学习

    接下来我们学习一下比较重要的库Pandas库,这个库比Numpy库还重要

    Pandas库是在Numpy库上进行了封装,相当于高级Numpy库

    在数据处理方面,运用Pandas库,也是非常多的,废话不多说

    先说第一个函数,read_csv,读取CSV数据文件

    import pandas
    food = pandas.read_csv("food_info.csv")
    print(type(food))
    print(food.dtypes)

    这里我打印了一下Type,可以看到类型为DataFrame,这个类型也是Pandas中,的核心类型

     下面我打印了一下,dtypes。可以看到,下面也是在pandas中非常常用的几种类型。

    int64,float64这两种就不用多说了。但是会发现一个新的类型。object类型

    这个类型就相当于str类型,也就是字符串类型值。

    然后接着,我们在运行一个函数

    food.head()

    这个函数的作用是,将我们数据中的,前5行打印出来。结果如下,

    那么如果我们想让数据显示多条怎么处理呢?

    food.head(8),只需要在这个函数中添加参数即可

    可以显示前面的,那么肯定可以显示后面的,

    food.tail(4)

    这个方法相当于显示最后面的4条数据

    如图所示,显示出最后的4行数据,可以看到跟数据中的数据做下对比,是一样的

    那么如果获取到数据表中,每一列的列名指标呢?

    print(food.columns)

    使用这个方便,可以或得到每个列表示的列名,结果是一个list,如下图

    还有一个要说的就是,如果看这个表的维度呢?我们直接在讲Numpy的时候讲过,如果查看矩阵的维度,用法一样,shape方法

    print(food.shape)

    可以看到如下结果,表示,当前数据,有8618 个样本,36个指标,36列

    我们如何从pandas中获取到某个数据呢?使用如下方法

    print(food.loc[0])

    这里我们可以看到,我们将第一个样本的全部值取出来了。对比结果。

    那么如果我们想去单独某条数据,那么只需要修改[0]到你需要的数据上即可。这里下标从0开始。

    大小超过数据的样本集,会直接报错。

    pandas中常用的数据类型如下

    object 就是我们常说的字符串类型

    int 整型

    float 浮点型

    bool 布尔型

    今天就先讲到这里我,感谢大家的阅读,谢谢!!

    更多好文章,请访问:https://www.yuanrenxue.com/

  • 相关阅读:
    linux ubuntu 现在显示的是ubuntu login
    stop-hbase.sh出现stopping hbasecat:/tmp/hbase-root-master.pid:No such file or directory
    hbase shell出现ERROR:Can't get master address from Zookeeper;znode data==null
    HADOOP:WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
    当Hadoop 启动节点Datanode失败解决
    数据挖掘步骤
    参加kaggle比赛
    招聘
    前端简历
    js和CSS3炫酷3D相册展示
  • 原文地址:https://www.cnblogs.com/ws17345067708/p/10720914.html
Copyright © 2011-2022 走看看