zoukankan      html  css  js  c++  java
  • 学习进度条15

     lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高

    XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言,它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索

    XPath的选择功能十分强大,它提供了非常简明的路径选择表达式,另外,它还提供了超过100个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有我们想要定位的节点,都可以用XPath来选择

    XPath于1999年11月16日成为W3C标准,它被设计为供XSLT、XPointer以及其他XML解析软件使用,更多的文档可以访问其官方网站:https://www.w3.org/TR/xpath/

    表达式描述

    nodename选取此节点的所有子节点

    /从当前节点选取直接子节点

    //从当前节点选取子孙节点

    .选取当前节点

    ..选取当前节点的父节点

    @选取属性

    *通配符,选择所有元素节点与元素名

    @*选取所有属性

    [@attrib]选取具有给定属性的所有元素

    [@attrib='value']选取给定属性具有给定值的所有元素

    [tag]选取所有具有指定元素的直接子节点

    [tag='text']选取所有具有指定元素并且文本内容是text节点

  • 相关阅读:
    Build MySQL 5.7.4 in RedHat
    glibc-2.19 之 strlen 实现
    [部署问题列表]
    [数据链路排查]
    VS配置本地IIS以域名访问
    SQL系列函数——数学函数
    面向对象编程的几个原则
    SQL系列函数——字符串函数
    SQL数据类型
    DHtmlx组件获取选中行的某一列对应的值
  • 原文地址:https://www.cnblogs.com/hhw12345/p/14909986.html
Copyright © 2011-2022 走看看