zoukankan html css js c++ java

java转义xml中的多余尖括号

xml中的敏感字符是尖括号，如果xml的值中含有尖括号，那么在解析的时候就会报错，如：

<?xml version="1.0" encoding="UTF-8"?><books><book><id>1</id><name><三国<><演><演>义</name><price>4<>5</price><author>罗贯中</author></book></books>

需要先对这些xml文件进行处理。
我的一个大概思路是这样的：
先利用正则找出所有的标签，再把标签存入一个ArrayList中，然后对照arraylist中的值，把标签两端的尖括号换成标记的字符串，然后转义掉剩余的所有尖括号，最后再把标记字符串转换成尖括号即可。
代码如下：

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class FilterXMLUtil {
    /**
     * 传入一个xml字符串，将其中的多余的<>转义后返回
     * @param xmlStr
     * @return
     */
    public static String filterIllegalityChar(String xmlStr) {
        //用来存放标签的集合
        List<String> tags = new ArrayList<String>();
        //去掉最前面的两个尖括号
        xmlStr = xmlStr.replace("<?xml", "?xml").replace(""UTF-8"?>", ""UTF-8"?");
        //通过正则找到所有的标签
        Pattern tag = Pattern.compile("<([a-zA-Z0-9]+)>");
        Matcher mc = tag.matcher(xmlStr);
        while(mc.find()){
            //匹配成功之后将之存入list中
            tags.add(mc.group(1));
        }
        /**
         * 临时替代符号
         * <-----------> ^^
         * >----------->~~
         * </---------->##/
         */
        for(int i = 0;i<tags.size();i++){
            xmlStr = xmlStr.replaceAll("<" + tags.get(i) + ">",
                    "^^"+tags.get(i)+"~~").replaceAll("</"+tags.get(i)+">", "##/"+tags.get(i)+"~~");
        }
        //转义
        xmlStr = xmlStr.replaceAll("<", "&lt;").replace(">", "&gt;");
        //转换回来
        xmlStr = xmlStr.replace("^^", "<").replace("~~", ">").replace("##/", "</").replace("?xml", "<?xml").replace(""UTF-8"?", ""UTF-8"?>");
        return xmlStr;
    }
}

输出：

<?xml version="1.0" encoding="UTF-8"?><books><book><id>1</id><name>&lt;三国&lt;&gt;&lt;演&gt;&lt;演&gt;义</name><price>4&lt;&gt;5</price><author>罗贯中</author></book></books>

这样就可以解析这个xml字符串了。

查看全文

相关阅读:
BiscuitOS/Linux 上构建 GFP_ZONE_TABLE【转】
二、buildroot 构建交叉编译工具链【转】
buildroot构建项目（一）---buildroot介绍【转】
使用buildroot创建自己的交叉编译工具链【转】
使用buildroot制作交叉编译工具链【转】
Perf 简介【转】
linux perf工具测试程序cpu cache刷回实验【转】
Linux下的内核测试工具——perf使用简介【转】
Build failed in step 'Retrieving needed toolchain components' tarballs【转】
利用Crosstool-ng制作交叉编译工具链【转】

原文地址：https://www.cnblogs.com/lenve/p/4614422.html