zoukankan      html  css  js  c++  java
  • java转义xml中的多余尖括号

    xml中的敏感字符是尖括号,如果xml的值中含有尖括号,那么在解析的时候就会报错,如:

    <?xml version="1.0" encoding="UTF-8"?><books><book><id>1</id><name><三国<><><></name><price>4<>5</price><author>罗贯中</author></book></books>
    

    需要先对这些xml文件进行处理。
    我的一个大概思路是这样的:
    先利用正则找出所有的标签,再把标签存入一个ArrayList中,然后对照arraylist中的值,把标签两端的尖括号换成标记的字符串,然后转义掉剩余的所有尖括号,最后再把标记字符串转换成尖括号即可。
    代码如下:

    import java.util.ArrayList;
    import java.util.List;
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    public class FilterXMLUtil {
        /**
         * 传入一个xml字符串,将其中的多余的<>转义后返回
         * @param xmlStr
         * @return
         */
        public static String filterIllegalityChar(String xmlStr) {
            //用来存放标签的集合
            List<String> tags = new ArrayList<String>();
            //去掉最前面的两个尖括号
            xmlStr = xmlStr.replace("<?xml", "?xml").replace(""UTF-8"?>", ""UTF-8"?");
            //通过正则找到所有的标签
            Pattern tag = Pattern.compile("<([a-zA-Z0-9]+)>");
            Matcher mc = tag.matcher(xmlStr);
            while(mc.find()){
                //匹配成功之后将之存入list中
                tags.add(mc.group(1));
            }
            /**
             * 临时替代符号
             * <-----------> ^^
             * >----------->~~
             * </---------->##/
             */
            for(int i = 0;i<tags.size();i++){
                xmlStr = xmlStr.replaceAll("<" + tags.get(i) + ">",
                        "^^"+tags.get(i)+"~~").replaceAll("</"+tags.get(i)+">", "##/"+tags.get(i)+"~~");
            }
            //转义
            xmlStr = xmlStr.replaceAll("<", "&lt;").replace(">", "&gt;");
            //转换回来
            xmlStr = xmlStr.replace("^^", "<").replace("~~", ">").replace("##/", "</").replace("?xml", "<?xml").replace(""UTF-8"?", ""UTF-8"?>");
            return xmlStr;
        }
    }

    输出:

    <?xml version="1.0" encoding="UTF-8"?><books><book><id>1</id><name>&lt;三国&lt;&gt;&lt;演&gt;&lt;演&gt;义</name><price>4&lt;&gt;5</price><author>罗贯中</author></book></books>
    

    这样就可以解析这个xml字符串了。

    版权声明:本文为博主原创文章,未经博主允许不得转载。

  • 相关阅读:
    rpm离线安装 ZZ https://www.cnblogs.com/Dev0ps/p/11027550.html
    系统记录一下用snmp获得华为/华3 设备cpu使用率的问题
    iperf3使用介绍
    ubuntu16上安装mysql并配置
    etcdserver: mvcc: database space exceeded的处理
    zz kafka的一些细节信息
    ZZ kafka性能问题调优
    日志处理时,遇到多种re表达式轮循匹配的高性能处理方式
    zz 微信小程序image组件中aspectFill和widthfix模式应用详解
    单元格移动时高亮
  • 原文地址:https://www.cnblogs.com/lenve/p/4614422.html
Copyright © 2011-2022 走看看