zoukankan      html  css  js  c++  java
  • 零基础入门到精通:Python大数据与机器学习之Pandas-数据操作

    在这里还是要推荐下我自己建的Python开发学习群:483546416,群里都是学Python开发的,如果你正在学习Python ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2018最新的Python进阶资料和高级开发教程,欢迎进阶中和进想深入Python的小伙伴.

    同时还要大数据学习群:784557197

    实战练习
    在Jupyter Notebook上执行以下代码:

    import pandas as pd
    
    df = pd.DataFrame({'col1':[1,2,3,4],'col2':[444,555,666,444],'col3':['abc','def','ghi','xyz']})
    
    df.head()
    

    获取唯一值

    df['col2'].unique()
    

    获取非唯一值

    df['col2'].nunique()
    

    获取每个值的个数

    df['col2'].value_counts()
    
    newdf = df[(df['col1']>2) & (df['col2']==444)]
    
    newdf
    

    应用函数

    def times2(x):
    
    return x*2
    
    df['col1'].apply(times2)
    

    df['col2'].apply(lambda x:x*2)
    
    
    

    df['col3'].apply(len)
    
    

    df['col1'].sum()
    
    

    永久删除一列

    del df['col1']
    
    df
    

    
    df = pd.DataFrame({'col1':[1,2,3,4],'col2':[444,555,666,444],'col3':['abc','def','ghi','xyz']})
    
    df.drop('col1',axis=1,inplace=True)
    
    df
    

  • 相关阅读:
    写在最顶部
    新一轮的战斗。
    Codeforces Round #180
    git学习笔记
    感悟、方向、计划
    .NET (c#)序列化和反序列化
    类的序列化发送和接受
    Log4Net: TextBoxBaseAppender
    任何成功不能只靠自己一个人
    技术问题,总是在短期被高估,在长期被低估
  • 原文地址:https://www.cnblogs.com/CoXieLearnPython/p/9181033.html
Copyright © 2011-2022 走看看