zoukankan      html  css  js  c++  java
  • Python3 BeautifulSoup和Pyquery解析库随笔

    BeautifuSoup和Pyquery解析库方法比较

    1.对象初始化:

    • BeautifySoup库:
      1 from bs4 import BeautifulSoup
      2 
      3 html = 'html string......'
      4 soup = BeautifulSoup(html, 'lxml')
    • Pyquery库:
      1 from pyquery import PyQuery as pq
      2 
      3 # 以字符串初始化
      4 html = 'html string...'
      5 doc = pq(html)
      6 # 以url初始化
      7 doc = pq(url='https://....')
      8 # 以文件初始化
      9 doc = pq(filename='XXX.html')

    2. 节点属性获取:

    • BeautifuSoup库:
      1 # 在根据节点选择器、方法选择器或者CSS选择器,选择出节点(例如:li)后,两种方法获取属性值
      2 value = li['attr_name']
      3 value = li.attrs['attr_name']
    • Pyquery库:
      1 # 在根据CSS选择器定位到节点(例如li)后,两种方法获取属性值
      2 value = li.attr.attr_name
      3 value = li.attr('attr_name')

    3. 文本内容获取

    • BeautifulSoup库:
      # 在根据节点选择器、方法选择器或者CSS选择器,选择出节点(例如:li)后,两种方法获取属性值
      text = li.string
      text = li.get_text()
    • Pyquery库: 
      1 # 在根据CSS选择器定位到节点(例如li)后
      2 text = li.text()
  • 相关阅读:
    CLR
    Cocos2dx 3.12 在AndroidStudio上编译配置
    MFC 调试方法
    列表初始化
    类型转换
    Cocos2d-x 3.4在AndroidStudio上编译配置
    出发 Let's Go
    LumiSoft.Net邮件接收乱码问题解决
    百度地图经纬度转换JS版
    百度经纬度和google经纬度互转
  • 原文地址:https://www.cnblogs.com/strivepy/p/9253311.html
Copyright © 2011-2022 走看看