导入相关jar包
package jsoup.zr.com.utils; import java.io.IOException; import java.util.List; import org.jsoup.Jsoup; import org.jsoup.nodes.Attribute; import org.jsoup.nodes.Attributes; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.nodes.Node; public class TestClass { public static void main(String[] args) { TestClass.paserHTML("https://www.baidu.com"); } /** * 通过URL来解析HTML * @param url */ public static void paserHTML(String url){ Document document = null; Element body = null; Element head = null; String title = null; String tagName = null; try { // 通过URL获取HTML文档 document = Jsoup.connect(url).get(); // 获取body部分 body = document.body(); // 获取head部分 head = document.head(); // 根据标签名找节点 List<Element> links = head.getElementsByTag("link"); for (Element element : links) { System.out.println(element.tagName()+","); // 根据key查找相关的属性value String value = element.attr("rel"); System.out.println("value:"+value); } // 获取标签名 tagName = head.tagName(); // 获取标题 title = document.title(); // 通过id选择器获取标签 Element element = document.getElementById("head"); // 获取文本内容 String connent = element.text(); System.out.println("id选择器:"+element.tagName()+",内容:"+connent); } catch (IOException e) { e.printStackTrace(); } System.out.println(document); } }