zoukankan      html  css  js  c++  java
  • pandas的数据筛选之isin和str.contains函数

    筛选是在平时的工作中使用非常频繁的功能,前文介绍了loc和iloc的筛选方法,现在继续介绍一些筛选的方法。

     
    DataFrame列表

    以>,<,==,>=,<=来进行选择(“等于”一定是用‘==’,如果用‘=’就不是判断大小了):

     
    选择quantity>25的所有行
     
    选择数量大于20或单价大于100的所有行

    使用 &(且) 和 |(或) 时每个条件都要用小括号括起来。

    选取多列一定是两个方括号,其中内侧方括号代表是一个list:

     
    使用一般方式
     
    使用loc函数

    如果要选择某列等于多个数值或者字符串时,要用到.isin(), 我们把df修改了一下(isin()括号里面应该是个list):

     
    使用isin函数筛选
     
    使用loc函数筛选

    平时使用最多的筛选应该是字符串的模糊筛选,在SQL语句里用的是like,在pandas里我们可以用.str.contains()来实现。

     
    使用str.contains函数筛选
     
    直接使用loc函数筛选

    也可以使用  '|'  来进行多个条件的筛选:

     
    筛选包含某一字符的行
     
    筛选包含某一字符的行
     
    多条件筛选

    注意,这个‘|’是在引号内的,而不是将两个字符串分别引起来。’&‘在这里不能用。

    如果中间的.str不用的话,就会出错,提示‘Series’数组没有‘contains'函数。

     
    str函数的作用

    其实.str的作用就是将’Series‘转换为类似Strings的结构,然后就可以用contains函数了。

    作者:探索数据之美
    链接:https://www.jianshu.com/p/805f20ac6e06

  • 相关阅读:
    (3.4)常用知识-char与varchar的选择
    (3.3)常用知识-索引使用、维护与填充因子
    (3.2)常用知识-字符串处理
    (3.1)常用知识-日期处理
    基于Sql Server 2008的分布式数据库的实践
    将expression转化为数据类型int时发生算术溢出错误
    webserver and application server
    web前端
    linkin
    jquery load
  • 原文地址:https://www.cnblogs.com/gaodi2345/p/11756513.html
Copyright © 2011-2022 走看看