zoukankan      html  css  js  c++  java
  • DataFrame按行读取:DataFrame之values

    http://blog.csdn.net/u014607457/article/details/51290582

        def fill_core(self):
            RatingTable=pd.read_csv(self.path+'/RatingTable.csv',header=None)
            list1=RatingTable.loc[0].values
            print(type(list1))
            print(list1)
    
            # print(RatingTable.index)RangeIndex(start=0, stop=943, step=1)
            # print(userRatingTable.loc[1][0:-1])
            # for indexs in RatingTable.index:
            #     print(RatingTable.loc[indexs].values)#返回value二维array
                # values[0:] values[0:-1]b是负数,表示去除后几位
                #%.2f是将该浮点数float保留两位小数。2表示保留的位数
                # val[0:-1] 是对字符串的截取操作,str[a:b]表示截取字符串的a开始的位置,b表示结束位置
                # b是负数,表示去出后几位
            # f1=open(self.path+'/RatingTable.csv','r',encoding='utf-8')
            # dict1=[]
            # for line1 in f1.readlines():
            #     tmp=[]
            #     theme_num=line1.strip().split(',')
            #     # print(theme_num)
            #     for g in theme_num:
            #         tmp.append(int(g))
            #     dict1.append(tmp)

    pandas是python环境下最有名的数据统计包,而DataFrame翻译为数据框,是一种数据组织方式,这么说你可能无法从感性上认识它,举个例子,你大概用过Excel,而它也是一种数据组织和呈现的方式,简单说就是表格,而在在pandas中用DataFrame组织数据,如果你不print DataFrame,你看不到这些数据,下面我们来看看DataFrame是如何使用的。

    首先是引入pandas和numpy,这是经常配合使用的两个包,pandas依赖于numpy,引入以后我们可以直接使用np/pd来表示这个两个模块

    先创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值

      

    为了快速入门,我们看一下如何创建一个6X4的数据:randn函数用于创建随机数,参数表示行数和列数,dates是上一步创建的索引列

     

    我们还可以使用字典来创建数据框,例如创建一个列名为A的数据框,索引是自动创建的整数

    这又是一个字典创建DataFrame的例子

    可以使用dtypes来查看各行的数据格式

    接着看一下如何查看数据框中的数据,看一下所有的数据

    使用head查看前几行数据(默认是前5行),不过你可以指定前几行

    查看前三行数据

    使用tail查看后5行数据

    查看数据框的索引

    查看列名用columns

    查看数据值,用values

    查看描述性统计,用describe

    使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据

    使用T来转置数据,也就是行列转换

    对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序。

    好了,这篇入门教程到这里,后面还有很多,希望有志同道合的朋友一起交流学习,有什么说的不对的地方,请批评指正。

  • 相关阅读:
    从helloworld回顾程序的编译过程之二
    笔试题知识点记录
    jQuery面试题与答案
    hdu2586(How far away ?)
    解析PHP跳出循环的方法以及continue、break、exit的区别介绍
    如何查看任何一下网站的全部二级域名?
    urlencode()与urldecode()
    基于 LaravelAdmin 在十分钟内搭建起功能齐全的后台模板
    第一种方式:cookie的优化与购物车实例
    右键菜单的响应问题
  • 原文地址:https://www.cnblogs.com/smuxiaolei/p/7630281.html
Copyright © 2011-2022 走看看