zoukankan      html  css  js  c++  java
  • jsoup 的简单应用

    导入相关jar包

    package jsoup.zr.com.utils;
    
    import java.io.IOException;
    import java.util.List;
    
    import org.jsoup.Jsoup;
    import org.jsoup.nodes.Attribute;
    import org.jsoup.nodes.Attributes;
    import org.jsoup.nodes.Document;
    import org.jsoup.nodes.Element;
    import org.jsoup.nodes.Node;
    
    public class TestClass {
        
        public static void main(String[] args) {
            TestClass.paserHTML("https://www.baidu.com");
        }
        /**
         * 通过URL来解析HTML
         * @param url
         */
        public static void  paserHTML(String url){
            Document document = null;
            Element body = null;
            Element head = null;
            String title = null;
            String tagName = null;
            try {
                // 通过URL获取HTML文档
                document = Jsoup.connect(url).get();
                // 获取body部分
                body = document.body();
                // 获取head部分
                head = document.head();
                
                // 根据标签名找节点
                List<Element> links = head.getElementsByTag("link");
                for (Element element : links) {
                    System.out.println(element.tagName()+",");
                    // 根据key查找相关的属性value
                    String value = element.attr("rel");
                    System.out.println("value:"+value);
                    
                }
                // 获取标签名
                tagName = head.tagName();
                
                // 获取标题    
                title = document.title();
                
                // 通过id选择器获取标签
                Element element = document.getElementById("head");
                // 获取文本内容
                String connent = element.text();
                System.out.println("id选择器:"+element.tagName()+",内容:"+connent);
            } catch (IOException e) {
                e.printStackTrace();
            }
            System.out.println(document);
        }
        
    }
  • 相关阅读:
    ul>li中自定义属性后取值的问题
    img标签src图片地址找不到显示默认图片
    jquery通配符说明
    jquery控制元素的显示与隐藏
    mysql中行转列与列传行的问题
    页面禁止滚动条
    HttpServletRequest继承字ServletRequest的常用方法
    系统间通信方式
    mysql函数积累
    java 用maven 构建项目时@Override错误的解决办法
  • 原文地址:https://www.cnblogs.com/lantu1989/p/6714456.html
Copyright © 2011-2022 走看看