zoukankan      html  css  js  c++  java
  • unique()与nunique()

    1 unique()

    统计list中的不同值时,返回的是array.它有三个参数,可分别统计不同的量,返回的都是array.

    当list中的元素也是list时,尽量不要用这种方法.

    import numpy as np
    a = [1,5,4,2,3,3,5]
    # 返回一个array
    print(np.unique(a))
    # 返回该元素在list中第一次出现的索引
    print(np.unique(a,return_index=True))
    # 返回原list中每个元素在新的list中对应的索引
    print(np.unique(a,return_inverse=True))
    # 返回该元素在list中出现的次数
    print(np.unique(a,return_counts=True))
    # 当加参数时,unique()返回的是一个tuple,这里利用了tuple的性质,即有多少个元素即可赋值给对应的多少个变量
    p,q,m,n = np.unique(a,return_index=True,return_inverse=True,return_counts=True)
    print(p,q,m,n)
    # [1 2 3 4 5]
    # (array([1, 2, 3, 4, 5]), array([0, 3, 4, 2, 1]))
    # (array([1, 2, 3, 4, 5]), array([0, 4, 3, 1, 2, 2, 4]))
    # (array([1, 2, 3, 4, 5]), array([1, 1, 2, 1, 2]))
    # [1 2 3 4 5] [0 3 4 2 1] [0 4 3 1 2 2 4] [1 1 2 1 2]
    
    # 注意当list中的元素不是数字而是list的时候,输出的数据类型与list中元素的长度有关
    # 利用这种方法对list中元素去重或求里面元素的个数都不是好方法,很容易出错
    b = [[1,2],[3,4]]
    print(np.unique(b))
    # b中有两个list,输出的却是4
    print(len(np.unique(b)))
    c = [[1,2],[3,4],[5]]
    print(np.unique(c))
    print(len(np.unique(c)))
    # [1 2 3 4]
    # 4
    # [list([1, 2]) list([3, 4]) list([5])]
    # 3
    View Code

    统计series中的不同值时,返回的是array,它没有其它参数

    import pandas as pd
    se = pd.Series([1,3,4,5,2,2,3])
    print(se.unique())
    # [1 3 4 5 2]
    View Code

    2 nunique()

    可直接统计dataframe中每列的不同值的个数,也可用于series,但不能用于list.返回的是不同值的个数.

    df=pd.DataFrame({'A':[0,1,1],'B':[0,5,6]})
    print(df)
    print(df.nunique())
    #    A  B
    # 0  0  0
    # 1  1  5
    # 2  1  6
    # A    2
    # B    3
    # dtype: int64

    也可与groupby结合使用,统计每个块的不同值的个数.

    all_user_repay = all_user_repay.groupby(['user_id'])['listing_id'].agg(['nunique']).reset_index()
    #    user_id  nunique
    # 0       40        1
    # 1       56        1
    # 2       98        1
    # 3      103        1
    # 4      122        1
  • 相关阅读:
    元组
    字典
    列表
    数据类型-字符串(str)
    python安装和首次使用
    javac++的stl解决重复的元素
    c++二分法求一个数的完全平方数
    双指针法----->求数组中两数之和
    java的二分法求一个数的平方根
    Java递归加上二分搜索将有序数组转化为平衡二叉树2
  • 原文地址:https://www.cnblogs.com/xxswkl/p/11009059.html
Copyright © 2011-2022 走看看