zoukankan      html  css  js  c++  java
  • Python【Pandas】取交集、并集、差集

    前堤条件:对于colums都相同的dataframe做过滤的时候

    创建2个结构(列名)一致的DataFrame,df1和df2有1条重合的数据

    import pandas as pd
    
    df1=pd.DataFrame([['a',10,'男'],['b',11,'女']],columns=['name','age','gender'])
    df2=pd.DataFrame([['a',10,'男']],columns=['name','age','gender'])
    df1
    
    name age gender
    0 a 10
    1 b 11
    df2
    
    name age gender
    0 a 10

    取交集

    pd.merge(df1,df2,on=['name','age','gender'])
    
    name age gender
    0 a 10

    取并集

    pd.merge(df1,df2,on=['name','age','gender'],how='outer')
    
    name age gender
    0 a 10
    1 b 11

    取差集

    df1=df1.append(df2)
    df1=df1.drop_duplicates(subset=['name','age','gender'],keep=False)
    df1
    
    name age gender
    1 b 11

    python pandas取交集、并集、差集

  • 相关阅读:
    poj 3310(并查集判环,图的连通性,树上最长直径路径标记)
    poj 3308(最小点权覆盖、最小割)
    poj 3281(网络流+拆点)
    poj 3275(传递闭包)
    poj 3204(最小割)
    poj 3164(最小树形图)
    poj 2987(最大权闭合图+割边最少)
    poj 2455(二分+最大流)
    poj 2391(二分+最大流)
    poj 2135(最小费用最大流)
  • 原文地址:https://www.cnblogs.com/kaerxifa/p/13155768.html
Copyright © 2011-2022 走看看