zoukankan      html  css  js  c++  java
  • Python学习笔记:统计次数的5种方法

    一、使用字典 dict 统计

    循环遍历出一个可迭代对象的元素,如果字典中没有该元素,那么就让该元素作为字典的键,并将该键赋值为1,如果存在则将该元素对应的值加1。

    lists = ['a','a','b',1,2,3,1]
    count_dist = dict()
    for i in lists:
        if i in count_dist:
            count_dist[i] += 1
        else:
            count_dist[i] = 1
    print(count_dist)
    # {'a': 2, 'b': 1, 1: 2, 2: 1, 3: 1}
    

    二、使用 collections.defaultdict 统计

    defaultdict(parameter) 接受一个类型参数,例如:intfloatstr 等。

    传递进来的类型参数,不是用来约束值的类型,更不是约束键的类型,而是当键不存在时,实现一种值的初始化。

    • defaultdict(int) -- 初始化为0
    • defaultdict(float) -- 初始化为0.0
    • defaultdict(str) -- 初始化为''
    from collections import defaultdict
    lists = ['a','a','b',1,2,3,1]
    count_dict = defaultdict(int)
    for i in lists:
        count_dict[i] += 1
    print(count_dict)
    # defaultdict(<class 'int'>, {'a': 2, 'b': 1, 1: 2, 2: 1, 3: 1})
    

    三、List count方法

    count() 方法用于统计某个元素在列表中出现的次数。

    • 使用语法
    # 使用语法
    list.count(obj) # 返回次数
    
    • 统计单个对象次数
    # 统计单个对象次数
    aList = [123, 'abc', 'good', 'abc', 123]
    print("Count for 123 :", aList.count(123))
    print("Count for abc :", aList.count('abc'))
    # Count for 123 : 2
    # Count for abc : 2
    
    • 统计List中每一个对象次数
    test = ["aaa","bbb","aaa","aaa","ccc","ccc","ddd","aaa","ddd","eee","ddd"]
    print(test.count("aaa"))
    # 4
    print(test.count("bbb"))
    # 1
    
    test_result = []
    for i in test:
        if i not in test_result:
            test_result.append(i)
    print(test_result)
    
    for i in test_result:
        print(f"{i}:{test.count(i)}")
    
    '''
    4
    1
    ['aaa', 'bbb', 'ccc', 'ddd', 'eee']
    aaa:4
    bbb:1
    ccc:2
    ddd:3
    eee:1
    '''
    

    四、使用集合(set)和列表(list)统计

    先用 set 去重,然后循环把每一个元素和对应的次数 list.count(item) 组成元组。

    lists = ['a','a','b',1,2,3,1]
    count_set = set(lists)
    print(count_set) # 集合去重
    # {1, 2, 3, 'b', 'a'}
    
    count_list = list()
    for i in count_set:
        count_list.append((i, lists.count(i)))
    print(count_list)    
    # [(1, 2), (2, 1), (3, 1), ('b', 1), ('a', 2)]
    

    五、collections.Counter方法

    Counter 是一个容器对象,使用 collections 模块中的 Counter 类可以实现 hash 对象的统计。

    Counter 是一个无序的容器类型,以字典的键值对形式存储,其中元素作为 key,其计数作为 value

    计数值可以是任意的 Interger(包括0和负数)。

    Counter() 对象还有几个可调用的方法:

    • most_common(n) -- TOP n 个出现频率最高的元素
    • elements -- 获取所有的键 通过list转化
    • update -- 增加对象
    • subtrct -- 删除对象
    • 下标访问 a['xx'] --不存在时返回0
    import collections
    c = collections.Counter('helloworld')
    
    • 直接显示各个元素频次
    print(c)
    # Counter({'l': 3, 'o': 2, 'h': 1, 'e': 1, 'w': 1, 'r': 1, 'd': 1})
    
    • 使用 most_common 显示最多的n个元素

    当多个元素计数值相同时,排列是无确定顺序的。

    print(c.most_common(3))
    # [('l', 3), ('o', 2), ('h', 1)]
    
    • 使用数组下标获取,类似字典方式
    print("The number of 'o':", c['o'])
    # The number of 'o': 2
    
    • 统计列表(只要列表中对象都是可以哈希的)
    import collections
    x = [1,2,3,4,5,6,7,8,1,8,8,8,4,3,5]
    c = collections.Counter(x)
    print(c)
    # Counter({1: 2, 2: 1, 3: 2, 4: 2, 5: 2, 6: 1, 7: 1, 8: 4})
    print(c.most_common(3))
    # [(8, 4), (1, 2), (3, 2)]
    dictc = dict(c) # 转换为字典
    print(dictc)
    # {1: 2, 2: 1, 3: 2, 4: 2, 5: 2, 6: 1, 7: 1, 8: 4}
    

    如果列表中有 unhashalbe 对象,例如:可变的列表,是无法统计的。

    元组也可以统计。

    c = collections.Counter([[1,2], "hello", 123, 0.52])
    # TypeError: unhashable type: 'list'
    

    得到 Counter 计数器对象之后,还可以在此基础上进行增量更新。

    • elements() -- 返回迭代器

    元素排列无确定顺序,个数小于1的元素不被包含。

    import collections
    c = collections.Counter(a=4,b=2,c=1)
    print(c)
    # Counter({'a': 4, 'b': 2, 'c': 1})
    
    list(c.elements())
    # ['a', 'a', 'a', 'a', 'b', 'b', 'c']
    
    • subtract函数 -- 减去元素
    import collections
    c = collections.Counter(["a","b","c","a"])
    print(c)
    # Counter({'a': 2, 'b': 1, 'c': 1})
    print(list(c.elements())) # 展开
    # ['a', 'a', 'b', 'c']
    
    # 减少元素
    c.subtract(["a","b"])
    print(c)
    # Counter({'a': 1, 'c': 1, 'b': 0})
    print(list(c.elements()))
    # ['a', 'c']
    
    • update函数 -- 增加元素

    在进行增量计数时候,update函数非常有用。

    import collections
    c = collections.Counter(["a","b","c","a"])
    print(c)
    # Counter({'a': 2, 'b': 1, 'c': 1})
    print(list(c.elements())) # 展开
    # ['a', 'a', 'b', 'c']
    
    c.update(["a","d"])
    print(c)
    # Counter({'a': 3, 'b': 1, 'c': 1, 'd': 1})
    print(list(c.elements()))
    # ['a', 'a', 'a', 'b', 'c', 'd']
    
    • del函数 -- 删除键

    当计数值为0时,并不意味着元素被删除,删除元素应当使用del

    import collections
    c = collections.Counter('helloworld')
    print(c)
    # Counter({'l': 3, 'o': 2, 'h': 1, 'e': 1, 'w': 1, 'r': 1, 'd': 1})
    
    c["d"] = 0
    print(c)
    # Counter({'l': 3, 'o': 2, 'h': 1, 'e': 1, 'w': 1, 'r': 1, 'd': 0})
    
    del c["l"]
    print(c)
    # Counter({'o': 2, 'h': 1, 'e': 1, 'w': 1, 'r': 1, 'd': 0})
    

    参考链接:Python List count()方法

    参考链接:python中统计列表中元素出现的次数

    参考链接:python 3 如何统计列表中各个元素个数/次数?

    参考链接:python中统计计数的几种方法

  • 相关阅读:
    Handsontable添加超链接
    Handsontable 筛选事件
    handsontable自定义渲染
    M1 Mac安装 Homebrew
    Pypi官网怎么找历史依赖包
    在 CentOS7 中我们在安装 MySQL
    Ansible使用yum安装
    Ansible集群自动化运维操作
    java对list中map集合中某个字段排序
    使用hive的orcfiledump命令查看orc文件
  • 原文地址:https://www.cnblogs.com/hider/p/15228187.html
Copyright © 2011-2022 走看看