zoukankan      html  css  js  c++  java
  • python爬虫常用数据整理函数

    text()                       获取xpath中的值。...../h1/text()


    extract()[0]              Selector的方法用于提取内容为一个数组。


    extract_first("")        与extract()[0]相同更加准确


    contains()     匹配一个属性值中包含的字符串 contains(@class, 'vote-post')


    strip()        把头和尾的空格去掉


    lstrip()       把左边的空格去掉


    rstrip()         把右边的空格去掉


    replace('c1','c2')   把字符串里的c1替换成c2。故可以用replace(' ','')来去掉字符串里的所有空格


    split()       通过指定分隔符对字符串进行切片,如果参数num 有指定值,则仅分隔 num 个子字符串

  • 相关阅读:
    sqlalchemy
    tornado-模板继承extend,函数和类的导入
    vi规范
    Spark 分布式SQL引擎
    Spark SQL 编程
    Spark SQL 基本原理
    spark SQL概述
    spark 多语言编程
    hadoop YARN
    spark 存储管理机制
  • 原文地址:https://www.cnblogs.com/wfnj/p/10794892.html
Copyright © 2011-2022 走看看