zoukankan      html  css  js  c++  java
  • CDATA嵌套 的实现

    今天代码解析一段XML时报错,经过检查发现里面有嵌套CDATA标志的情况,导致XML结构发生了变化,不能转换为xml对象了,百度下,找到下面的解决方案,测试下好使,分享下!

     

    http://hi.baidu.com/yin_xiaogang/blog/item/f0f4a4ce3ef0c50592457e78.html

     

    在CDATA内部的所有内容都会被解析器忽略。一个 CDATA 部件以"<![CDATA[" 标记开始,以"]]>"标记结束。但是要记住,CDATA是不能够嵌套的。但是现在,就是有人要求实现CDATA的嵌套。

    比如,将下面这段XML加到另外一个XML的某个元素里面:

    <?xml version="1.0" encoding="UTF-8" ?>
    <System><id>library</id>
    <name>Library Management</name>
    <description><![CDATA[This is a sample library management subsystem for Signet.]]></description>
    <Categories>
    <System/>

    将内部的CDATA的结尾转义?那就变成了"<![CDATA[" 和"]]>amp;",这样不好吧,老师说,接收XML的那一方怎么会知道你在里面加上了转义?

    那么,可以把CDATA的结尾的"]]>"破坏掉,把它分到两个CDATA中,然后调用Java的API读取该元素的数据时,实际上API同时读取两个CDATA块,然后合成一个。

    那么,把上面的XML作为一个字符串来处理,将"]]>"替换为"]]]]><![CDATA[",千万要记住,不要包含空格进去。这样,结果应该是

    <?xml version="1.0" encoding="UTF-8"?>
    <Messages>
    <Message type="data">
    <code>1199242678515-176590595</code>
    <date>2008/01/02</date>
    <time>10:57:58</time>
    <content><![CDATA[<?xml version="1.0" encoding="UTF-8" ?>
    <System><id>library</id>
    <name>Library Management</name>
    <description><![CDATA[This is a sample library management subsystem for Signet.]]]]><![CDATA[></description>
    <Categories>
    <System/>]]></content>
    </Message>

    </Messages>

    这样,利用Object org.dom4j.Element.getData()方法得到的数据才是原始的XML片段。


  • 相关阅读:
    [ARC074C] RGB Sequence
    [SHOI2014] 概率充电器
    CF368B Sereja and Suffixes
    CF980D Perfect Groups
    Rainbow Roads(gym101617G)(DFS序,差分)
    Educational Codeforces Round 104 (Rated for Div. 2)(A~E)
    Floor and Mod(CF1485C)(数论)
    Longest Simple Cycle(CF1476C)(线性dp)
    Factories(Gym102222G)(树形dp+背包)
    Codeforces Round #699 (Div. 2)(A,B,C,D)
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13318373.html
Copyright © 2011-2022 走看看