zoukankan      html  css  js  c++  java
  • 18-09-20 关于Excel 表格重复问题解决示例

     代码实现:b=a.drop_duplicates(subset=None, keep='first', inplace=False)


    Excel 去除重复项

    在测试过程中,会经常遇到多张表格筛选比对的过程,筛选出的结果导入到一张新表,往往新表中会有许多重复项,我们需要清除这些重复的项,只留下唯一的项即可。
    我们可以利用 pandas 库中的 drop_duplicates 方法实现。

    函数用法:
    DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

    参数
    这个 drop_duplicate 方法是对 DataFrame 格式的数据,去除特定列下面的重复行。返回 DataFrame 格式的数据。

    subset : 用来指定特定的列,默认所有列

    keep : 删除重复项并保留第一次出现的项

    inplace:默认 False,在原来数据上修改

  • 相关阅读:
    程序员都必读
    ia-64 vs x86-64
    Linux内核学习
    开源liscense对比
    列存储
    大数据科普
    [USACO1.5]数字三角形
    [USACO08FEB]酒店Hotel
    数的划分
    CodeForce 18D
  • 原文地址:https://www.cnblogs.com/xiaoluoboer/p/9679536.html
Copyright © 2011-2022 走看看