zoukankan html css js c++ java

xpath解析基础

import requests
from lxml import etree

if __name__ == "__main__":
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
    }   # UA伪装
    # 实例化好了一个etree对象，且将被解析的文件加载到了对象中
    tree = etree.parse('test.html')
    # r = tree.xpath('/html/body/div') # '/html'中'/'从根目录(根节点)
    # r1 = tree.xpath('/html//div') # '//'表示示的是多个层级
    # r2 = tree.xpath('//div') # '//'表示的是多个层级
    # r = tree.xpath('//div[@class="song"]')
    # r = tree.xpath('//div[@class="song"]/p[3]') # 索引定位从1开始
    # r = tree.xpath('//div[@class="tang"]//li[5]/a/text()')[0] # 索引定位从1开始
    # r = tree.xpath('//div[@class="tang"]//li[7]//text()')[0] # 索引定位从1开始
    r = tree.xpath('//div[@class="song"]/img/@src')# 索引定位从1开始

    print(r)

查看全文

相关阅读:
LIS
原根
 数三角形
 组合数问题
 最短路问题
 2020总结
 树状数组
 康托展开
 LCA
并查集

原文地址：https://www.cnblogs.com/huahuawang/p/12692438.html

热门文章
忠诚
 线段树1
LCA-最近公共祖先
 ST表
 洛谷p2118 比例简化
 洛谷p3152
p1036 选数
 p1981 表达式求值
 洛谷p2010 回文日期
 知识合集（板子）