zoukankan      html  css  js  c++  java
  • python pandas replace函数

    在处理数据的时候,很多时候会遇到批量替换的情况,如果一个一个去修改效率过低,也容易出错。replace()是很好的方法。

    1.基本结构:

    df.replace(to_replace, value) 前面是需要替换的值,后面是替换后的值。

    这样会搜索整个DataFrame, 并将所有符合条件的元素全部替换。

    进行上述操作之后,其实原DataFrame是并没有改变的。改变的只是一个复制品。

    2. 如果需要改变原数据,需要添加常用参数 inplace=True

    这个参数在一般情况没多大用处,但是如果只替换部分区域时,inplace参数就有用了。

    在上面这个操作中,‘合计’这一列中的0,并没有被替换。只有‘金额’这一列的0被替换,而且,替换后的结果不需要我们再和原数据进行合并操作,直接体现在原数据中。

    只对某一列特定的值进行替换:

    result['prediction'].replace([0,1,2,3,4,5,6,7,8],[870,870,880,898,1300,13117,13298,13690,13691],inplace=True)

    BTW: 在pyspark 中的 replace() 函数

    result.na.replace([0,1,2,3,4,5,6,7,8], [870,878,880,898,1300,13117,13298,13690,13691], 'prediction')

    https://www.cnblogs.com/nshuai/articles/5762343.html

  • 相关阅读:
    POJ2104&&HDU2665(静态区间第K小)
    HDU4763
    js 获取视频的第一帧
    hadoop 集群配置
    redis_cli 批量删除
    vmware centos 7 更新vmware-tools
    php计算两个整数的最大公约数常用算法小结
    centOS 7 配置NAT模式
    centOS配置NAT模式
    show table status 获取表的信息
  • 原文地址:https://www.cnblogs.com/Allen-rg/p/10148212.html
Copyright © 2011-2022 走看看