zoukankan      html  css  js  c++  java
  • jsoup工具类

    public class HtmlUtils {

    // 只有纯文本可以通过
    public static String getText(String html) {
    if (html == null)
    return null;
    return Jsoup.clean(html, Whitelist.none()).replace(" ", "");
    }

    // 以下标签可以通过
    // b, em, i, strong, u. 纯文本
    public static String getSimpleHtml(String html) {
    if (html == null)
    return null;
    return Jsoup.clean(html, Whitelist.simpleText());
    }

    // 以下标签可以通过
    //a, b, blockquote, br, cite, code, dd, dl, dt, em, i, li, ol, p, pre, q, small, strike, strong, sub, sup, u, ul
    public static String getBasicHtml(String html) {
    if (html == null)
    return null;
    return Jsoup.clean(html, Whitelist.basic());
    }

    //在basic基础上 增加图片通过
    public static String getBasicHtmlandimage(String html) {
    if (html == null)
    return null;
    return Jsoup.clean(html, Whitelist.basicWithImages());
    }
    // 以下标签可以通过
    //a, b, blockquote, br, caption, cite, code, col, colgroup, dd, dl, dt, em, h1, h2, h3, h4, h5, h6, i, img, li, ol, p, pre, q, small, strike, strong, sub, sup, table, tbody, td, tfoot, th, thead, tr, u, ul
    public static String getFullHtml(String html) {
    if (html == null)
    return null;
    return Jsoup.clean(html, Whitelist.relaxed());
    }

    //只允许指定的html标签
    public static String clearTags(String html, String ...tags) {
    Whitelist wl = new Whitelist();
    return Jsoup.clean(html, wl.addTags(tags));
    }

    // 对关键字加上颜色
    public static String markKeywods (String keywords, String target) {
    if (StringKit.notBlank(keywords)) {
    String[] arr = keywords.split(" ");
    for (String s : arr) {
    if (StringKit.notBlank(s)) {
    String temp = "<span class="highlight">" + s + "</span>";
    if(temp!=null)
    target = target.replaceAll(s, temp);
    }
    }
    }
    return target;
    }

    // 获取文章中的img url
    public static String getImgSrc(String html) {
    if (html == null)
    return null;
    Document doc = Jsoup.parseBodyFragment(html);
    Element image = doc.select("img").first();
    return image == null ? null : image.attr("src");
    }

    ————————————————
    版权声明:本文为CSDN博主「骑猪下不来的猴」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/weixin_42529699/article/details/90402489

  • 相关阅读:
    POJ1486 Sorting Slides 二分图or贪心
    POJ2060 Taxi Cab Scheme 最小路径覆盖
    POJ3083 Children of the Candy Corn 解题报告
    以前的文章
    POJ2449 Remmarguts' Date K短路经典题
    这一年的acm路
    POJ3014 Asteroids 最小点覆盖
    POJ2594 Treasure Exploration 最小路径覆盖
    POJ3009 Curling 2.0 解题报告
    POJ2226 Muddy Fields 最小点集覆盖
  • 原文地址:https://www.cnblogs.com/java-llp/p/11889085.html
Copyright © 2011-2022 走看看