zoukankan      html  css  js  c++  java
  • Python for Data Science

    Chapter 2 - Data Preparation Basics

    Segment 3 - Removing duplicates

    import numpy as np
    import pandas as pd
    
    from pandas import Series, DataFrame
    

    Removing duplicates

    DF_obj = DataFrame({'column 1':[1,1,2,2,3,3,3],
                        'column 2':['a','a','b','b','c','c','c'],
                        'column 3':['A','A','B','B','C','C','C']})
    DF_obj
    
    column 1 column 2 column 3
    0 1 a A
    1 1 a A
    2 2 b B
    3 2 b B
    4 3 c C
    5 3 c C
    6 3 c C
    DF_obj.duplicated()
    
    0    False
    1     True
    2    False
    3     True
    4    False
    5     True
    6     True
    dtype: bool
    
    DF_obj.drop_duplicates()
    
    column 1 column 2 column 3
    0 1 a A
    2 2 b B
    4 3 c C
    DF_obj = DataFrame({'column 1':[1,1,2,2,3,3,3],
                        'column 2':['a','a','b','b','c','c','c'],
                        'column 3':['A','A','B','B','C','D','C']})
    DF_obj
    
    column 1 column 2 column 3
    0 1 a A
    1 1 a A
    2 2 b B
    3 2 b B
    4 3 c C
    5 3 c D
    6 3 c C
    DF_obj.drop_duplicates(['column 3'])
    
    column 1 column 2 column 3
    0 1 a A
    2 2 b B
    4 3 c C
    5 3 c D
    
    
    相信未来 - 该面对的绝不逃避,该执著的永不怨悔,该舍弃的不再留念,该珍惜的好好把握。
  • 相关阅读:
    Linux添加硬盘并分区格式化
    Struts2/XWork 安全漏洞及解决办法
    Java中ArrayList和 LinkedList区别
    java位操作
    Spring Cloud Config 分布式配置中心【Finchley 版】
    实现win2003下mysql数据库每天自动备份
    模仿IE自动完成功能,非常完美(转)
    高级自定义查询、分页、多表联合存储过程(转)
    文本框位置
    英文论坛常用
  • 原文地址:https://www.cnblogs.com/keepmoving1113/p/14222849.html
Copyright © 2011-2022 走看看