zoukankan      html  css  js  c++  java
  • python中利用pandas读写csv文件

    问题1:错误提示:UnicodeDecodeError: 'ascii' codec can't decode byte 0xb8

    原因:含有中文字符

    import pandas
    
    pandas.read_csv(r'C:	est.csv',encoding='gbk')

     问题2:将DataFrame格式的文件保存为csv格式,比如,DF变量为DataFrame格式的数据

    DF.to_csv(r'C:	est.csv',encoding='gbk')

    问题3:将特定格式的字符串保存为csv文件,比如

    string_data = "1111,2222,242424,,55325,36666,112414" 
    pd_data = pd.Series(string_data)
    pd_data_expend = pd_data.str.split(",", expand=True)
    pd_data.shape
    pd_data_expend.shape

    问题4:如何删除DataFrame存在重复数据?

    import pandas as pd
    
    DataFrame.drop_duplicates()

     问题5:to_csv保存的时候,如何隐藏行和列的头文件?

    import pandas as pd
    
    DataFrame.to_csv(r"*	est.csv", header=False, index=False)

     问题6:dict的keys具有无序的特性,如何保证dict转为dataframe数据时,按照制定的列进行排列? 比如Data ={'col2': [3, 4], 'col4': [1, 2]}

    import pandas as pd
    
    Data = {'col2': [3, 4], 'col4': [1, 2]}
    pd.DataFrame(Data)

    输出结果:

          col2  col4
    0      3       1
    1      4       2

    import pandas as pd
    
    Data = {'col2': [3, 4], 'col4': [1, 2]}
    pd.DataFrame(Data, columns=["col4","col2"])

      输出结果: 

       col4  col2
    0  1      3
    1  2      4

    如果columns中的知道的字符串不存在,将自动赋值为NAN

    import pandas as pd
    Data = {'col2': [3, 4], 'col4': [1, 2]}
    pd.DataFrame(Data, columns=["col4","col2", "col10"])

    输出结果为:

          col4  col2  col10
    0      1     3      NaN
    1      2    4       NaN

  • 相关阅读:
    Linux网络编程一站式学习
    quick-cocos2d-x教程8:程序框架内lib文件夹分析
    petshop4.0 具体解释之中的一个(系统架构设计)
    LNK快捷方式漏洞利用方式 exp制作教程
    Serializable 作用
    0 1背包模板
    跟着辛星认识一下PHP的自己主动载入
    海茶3 らぶデス3 入门经典教程
    win下vm10+mac os 10.9安装遇到问题
    enum 在c中的使用
  • 原文地址:https://www.cnblogs.com/ystwyfe/p/8289044.html
Copyright © 2011-2022 走看看