zoukankan      html  css  js  c++  java
  • 富文本中文字部分提取

    //富文本编辑器内的内容保存到数据库后是一段html代码,先因某些需求需要去掉其中的样式等内容,只保留文字,代码如下:
    public class HtmlToText extends HTMLEditorKit.ParserCallback {
        private static HtmlToText html2Text = new HtmlToText();
        StringBuffer stringBuffer;
        private HtmlToText() {
        }
        public void parse(String str) throws IOException {
            InputStream iin = new ByteArrayInputStream(str.getBytes());
            Reader in = new InputStreamReader(iin);
            stringBuffer = new StringBuffer();
            ParserDelegator delegator = new ParserDelegator();
            delegator.parse(in, this, Boolean.TRUE);
            iin.close();
            in.close();
        }
        public void handleText(char[] text, int pos) {
            stringBuffer.append(text);
        }
        public String getText() {
            return stringBuffer.toString();
        }
        public static String getContent(String str) {
            try {
                html2Text.parse(str);
            } catch (IOException e) {
                e.printStackTrace();
            }
            return html2Text.getText();
        }
        public static void main(String[] args) {
            String text = HtmlToText.getContent("你的富文本字符串");
            System.out.println(text);
        }
    }
    

      

  • 相关阅读:
    Build a pile of Cubes
    一键升级所有pip过期库
    AWGN
    调制详解——待完善
    BASK、BFSK、BPSK调制方法的Matlab程序实现
    tomcat运行问题解决方法
    ehcache简单使用
    MySQL 数据库中用户表中口令登陆设置
    和自己赛跑的人
    中文词频统计
  • 原文地址:https://www.cnblogs.com/ShouWangYiXin/p/13929885.html
Copyright © 2011-2022 走看看