zoukankan      html  css  js  c++  java
  • pandas中series求交集

    在进行数据探索的时候会遇到求交集的情况,比如说:优惠卷预测的时候,有多张表,表1有用户id,表2也有用户id,但是不能确定表1的用户有多少出现在表2当中。

    un_id1,un_id2 为两个 Series 对象:

    un_id1 = set(un_id1)
    un_id2 = set(un_id2)
    tmp = un_id1.intersection(un_id2)
    len(tmp)

    即可求出交集的个数。。

    后来又找到一个去重函数:drop_duplicates

  • 相关阅读:
    audio_policy.conf说明(翻译)
    Qt
    linux C
    Linux C
    Linux C
    Qt
    Qt
    JSON
    JSON
    Qt
  • 原文地址:https://www.cnblogs.com/hbwxcw/p/7149711.html
Copyright © 2011-2022 走看看