-
基本步骤如下:
1、导包
2、获取document文档
2.1、如何获取document文档 反射获取path
3、获取document之后,获取Elements
4、根据elements提供的方法进行相关的操作
-
代码如下:
1 package com.cmf.jsoup;
2
3 import org.jsoup.Jsoup;
4 import org.jsoup.nodes.Document;
5 import org.jsoup.nodes.Element;
6 import org.jsoup.select.Elements;
7
8 import java.io.File;
9 import java.io.IOException;
10
11 /*
12 * Jsoup的快速入门
13 * */
14 public class JsoupDemo1 {
15 //基本步骤如下:
16 //1.导包
17 //2.获取document文档
18 //2.1 如何获取document文档 反射获取path
19 //3.获取document之后,获取Elements
20 //4.根据elements提供的方法进行相关的操作
21 public static void main(String[] args) {
22 //获取student.xml的路径
23 String path = JsoupDemo1.class.getClassLoader().getResource("student.xml").getPath();
24
25 //打印测试path路径是在什么地方
26 System.out.println("path:"+path);
27
28 System.out.println("-------------------------");
29
30 //编码格式为utf-8
31 //此处抛异常
32 Document document = null;
33
34 try {
35 document = Jsoup.parse(new File(path),"utf-8");
36 } catch (IOException e) {
37 e.printStackTrace();
38 }
39
40 //打印
41 System.out.println("document:"+document);
42
43 System.out.println("-------------------------");
44
45 //得到Elements
46 Elements elements = document.getAllElements();
47
48 //获取id元素 这里的id为2
49 Element element = document.getElementById("2");
50
51 //打印
52 System.out.println("element:"+element);
53
54 System.out.println("=========================");
55
56 //获取标签元素
57 Elements elements1 = document.getElementsByTag("name");
58
59 //打印
60 System.out.println("elements1 tagName:"+elements1);
61
62 System.out.println("=========================");
63
64 //获取文本内容
65 String strelement1 = elements1.text();
66
67 //打印
68 System.out.println("strelement1:"+strelement1);
69 }
70 }
-
运行效果图如下:
-
需要注意的点:
- 创建项目时,文件目录尽量别有中文,会乱码。
-
心得与感悟:
第一次写博客,有点不熟悉这里各种各样的功能,样式也没调成自己想要的样子,内容也不全面,不过才刚刚开始,后期会写出更好的博客分享到这里,请敬请期待。
2020-08-18 22:50:00