zoukankan      html  css  js  c++  java
  • lxml中的etree(待补)

    待查看源码,为什么打印出来的类型是这样
    类型集合返回如下:

    1. <class 'list'>
      2.<class 'lxml.etree._Element'>
      3.<class 'lxml.etree._ElementUnicodeResult'> # 这里就是普通字符串了,可以执行写入文件操作
    import xlwt
    import requests
    from lxml import etree
    import time
    
    
    def getOnePage(url):
        html = requests.get(url)
        selector = etree.HTML(html.text)
        # 查询节点的话表格就要表格的节点,这里以ul节点查询为例//ul[@class="all-img-list cf"]/li
        # XPath定位节点返回的是节点集合
        infos = selector.xpath('//*[@id="book-img-text"]/ul/li') # //*[@id="book-img-text"]/ul/li[1]
        # 打印一些节点
        print(infos) 
        print(type(infos)) # <class 'list'>
        for info in infos:
            print(type(info)) # <class 'lxml.etree._Element'>
            print(info) # <Element li at 0x19dc2c7e0c8>
            print('
    ')
            style_1 = info.xpath('div[2]/p[1]/a[2]/text()')[0]
            style_2 = info.xpath('div[2]/p[1]/a[3]/text()')[0]
            print(style_1,type(style_1)) # <class 'lxml.etree._ElementUnicodeResult'>
            print('
    ')
            print(style_2,type(style_2))
    getOnePage('https://www.qidian.com/all/page%7B%7D/') # 打印出来的尽然是内存地址列表
    
    努力拼搏吧,不要害怕,不要去规划,不要迷茫。但你一定要在路上一直的走下去,尽管可能停滞不前,但也要走。
  • 相关阅读:
    day1记一次无列名注入
    无参数RCE
    ThinkPHP 5.x远程命令执行漏洞
    phpmyadmin4.8.1文件包含漏洞
    foreach循环导致变量覆盖
    绕过空格的报错注入
    布尔盲注payload补充
    php后台验证两种方式绕过
    CentOS yum 配置阿里镜像
    CentOS通过yum安装配置Java环境
  • 原文地址:https://www.cnblogs.com/wkhzwmr/p/15311502.html
Copyright © 2011-2022 走看看