zoukankan      html  css  js  c++  java
  • Jsoup_Select 选择器

    Jsoup_Select 选择器

    一,概述

     可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    二,Jsoup对象的使用

    • parse(File in,String charsetName):解析XML或html文件
    • ​parse(String html):解析xml或html的文档对象
    • parse(URL url,int timeoutMillis):通过网络路径指定的html或xml的文档对象

    • 需解析xml代码

    <?xml version="1.0" encoding="UTF-8"?>
    <students>
        <student id="1">
            <name>戴延也</name>
            <age>18</age>
            <sex>女</sex>
        </student>
        <student id="2" class="rad">
            <name>文海涛</name>
            <age>19</age>
            <sex>男</sex>
        </student>
        <student id="3" class="pink">
            <name name="xx">戴小涛</name>
            <age>10</age>
            <sex>男</sex>
        </student>
    </students>
    • 属性名为“ attr”且值以“ valPrefix”开头的元素
                Elements elements7=document.select("[class^=pink]");
                System.out.println("elements7:"+elements7);
    • 属性名为“ attr”且值等于“ val”的元素
     Elements elements6=document.select("[id=2]");
                System.out.println("elements6:"+elements6);

    • 包含指定文本的元素。搜索不区分大小写。文本可能出现在找到的元素或其任何后代中。

     Elements elements4=document.select("student:contains(文海涛)");
                System.out.println("elements4:"+elements4);

     • 类名称为“ class”的元素

    Elements elements5=document.select(".pink");
                System.out.println("elements5:"+elements5);

    •代码运行效果

    *****************************
    elements4:<student id="2" class="rad"> 
     <name>
      文海涛
     </name> 
     <age>
      19
     </age> 
     <sex></sex> 
    </student>
    *****************************
    elements5:<student id="3" class="pink"> 
     <name name="xx">
      戴小涛
     </name> 
     <age>
      10
     </age> 
     <sex></sex> 
    </student>
    *****************************
    elements6:<student id="2" class="rad"> 
     <name>
      文海涛
     </name> 
     <age>
      19
     </age> 
     <sex></sex> 
    </student>
    *****************************
    elements7:<student id="3" class="pink"> 
     <name name="xx">
      戴小涛
     </name> 
     <age>
      10
     </age> 
     <sex></sex> 
    </student>
    *****************************
    elements8:<name name="xx">
     戴小涛
    </name>
  • 相关阅读:
    IronPython 0.7.6 released
    《用 .NET 开发的轻量级 UI 测试自动化》 的VS2005版本
    VistaDB 2.1 database for .NET has been released
    ORMapper or Object DataBase
    为什么要用Generic
    我的新文章:NTier Server/(Smart)Client 应用程序的设计和开发
    Advanced .NET Remoting, Second Edition
    Windows Mobile 5.0发布!
    Ajax对构架影响的思考
    SmartCode 的源代码
  • 原文地址:https://www.cnblogs.com/dyywht/p/13531115.html
Copyright © 2011-2022 走看看