zoukankan      html  css  js  c++  java
  • pandas数据框,统计某列或者某行数据元素的个数

    版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
    本文链接:https://blog.csdn.net/sinat_38893241/article/details/80414977
    在《pandas数据框,统计某列数据与其他文件对应关系的个数》之后,我发觉简单版的元素个数统计问题没有说清楚,就在这里介绍两个统计pandas数据框里面列、行元素个数的方法:

    代码如下:

    import pandas as pd
    import numpy as np

    df = pd.DataFrame(np.zeros((8,4)))#新建一个数据框
    df.iloc[2:6,0]=1#将第0列的第3行到第6行的值改为1



    def getlistnum(li):#这个函数就是要对列表的每个元素进行计数
    li = list(li)
    set1 = set(li)
    dict1 = {}
    for item in set1:
    dict1.update({item:li.count(item)})
    return dict1

    zero_col_count = getlistnum(df[0])#df[0]指列名为0的列,如果你的列名是字符串就要加引号
    three_row_count = getlistnum(df.loc[3])#df.loc[0]指行名为0的行,同样字符串的话要加引号
    新建数据框并改值

    统计得到结果

    当然,我们可以用pandas库自带的统计值函数,这样效率更高,代码如下:

    zero_col_count = dict(df[0].value_counts())#统计第0列元素的值的个数
    three_row_count = dict(df.loc[3].value_counts())#统计第3行元素的值的个数
    ————————————————
    版权声明:本文为CSDN博主「CommaDou」的原创文章,遵循CC 4.0 by-sa版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/sinat_38893241/article/details/80414977

  • 相关阅读:
    【php数组函数序列】之array_values()
    Mysql数据库编码问题3(修改数据库,表,字段编码为utf8)
    framework fckedit / KingEditor
    Linux + JDK/TOMCAT/Dia(Planner)/eclipse
    proxyServer squid / varnish / apache traffic server / ATS
    framework SiteMesh
    Linux + BusyBox
    对链表的插入操作
    链表原理
    链表的删除操作
  • 原文地址:https://www.cnblogs.com/jfdwd/p/11429314.html
Copyright © 2011-2022 走看看