重复值处理

import pandas as pd
#生成重复数据
data1 = ['a',3]
data2 = ['b',2]
data3 = ['a',3]
data4 = ['c',2]
df = pd.DataFrame([data1,data2,data3,data4],columns=['col1','col2'])
print(df)

#判断重复数据
isDuplicated = df.duplicated() #判断重复数据记录
print(isDuplicated)#打印输出

#删除重复值
new_df1 = df.drop_duplicates() #删除数据记录中所有列值相同的记录
new_df2 = df.drop_duplicates(['col1']) #删除数据记录中col1值相同的记录
new_df3 = df.drop_duplicates(['col2'])#删除数据记录中col2值相同的记录
new_df4 = df.drop_duplicates(['col1','col2']) #删除数据记录中col1/col2值相同的记录
print(new_df1)
print(new_df2)
print(new_df3)
print(new_df4)

查看全文

相关阅读:
Spring MVC 完全注解方式配置web项目
 spring WebServiceTemplate 调用 axis1.4 发布的webservice
修改Intellij Idea 创建maven项目默认Java编译版本
 Git Commit提交规范和IDEA插件Git Commit Template的使用
 myEclipse10安装以及破解
 ES6中Map与其他数据结构的互相转换
 ES6用来判断数值的相关函数
 WebStorm使用码云插件问题
 Css解决表格超出部分用省略号显示
 Js/Jquery获取网页屏幕可见区域高度

原文地址：https://www.cnblogs.com/qiuyuyu/p/10060638.html