zoukankan      html  css  js  c++  java
  • xml元素类型PCDATA和CDATA的区别(DTD中)

     

    PCDATA
    PCDATA 的意思是被解析的字符数据(parsed character data)。可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。文本中的标签会被当作标记来处理,而实体会被展开。不过,被解析的字符数据不应当包含任何 & < > 字符;需要使用 &amp; &lt; &gt; 实体来分别替换它们。


    CDATA
    CDATA 的意思是字符数据(character data)。CDATA 是不会被解析器解析的文本。在这些文本中的标签不会被当作标记来对待,其中的实体也不会被展开。
    几个实体引用字符:
    &lt; <
    &gt; >
    &amp; &
    &quot; "
    &apos; '


    又有网上有人这样说,我觉得挺直观,先转过来:
    PCDATA表示已解析的字符数据。
    CDATA是不通过解析器进行解析的文本,文本中的标签不被看作标记。CDATA表示里面是什么数据XML不会解析,比如

    1. <![CDATA[ 
    2. if(a>b){ 
    3. System.out.println(a); 
    4. ]]> 


    注意上面的a与b之间的 > 符号.

    PCDATA的数据是要给xml解析器去解析的,那上面的>去解析肯定会出错了,所以要用实体定义。上面的数据如果用PCDATA表示应该如下:

    1. if(a&gt;b){  
    2. System.out.println(a);  
    3. }


    CDATA是在XML文档里面使用的关键字,用来告诉浏览器,这部分内容不用解析,是给其他程序用的,比如js代码等。CDATA 部分由 "<![CDATA[" 开始,由 "]]>" 结束:

    1. <script>  
    2. <![CDATA[  
    3. function matchwo(a,b){  
    4. if (a < b && a < 0){  
    5. return 1;  
    6. }  
    7. else{  
    8. return 0;  
    9. }  
    10. }  
    11. ]]>  
    12. </script>  

    #PCDATA是在 XML约束文档里使用的,如DTD类型的约束文档,在这里面表示元素的内容或属性的取值范围等等,是字符串形式的

    1. <?xml version="1.0"?> 
    2. <!DOCTYPE note [ 
    3.   <!ELEMENT note (to,from,heading,body)
    4.   <!ELEMENT to      (#PCDATA)
    5.   <!ELEMENT from    (#PCDATA)
    6.   <!ELEMENT heading (#PCDATA)
    7.   <!ELEMENT body    (#PCDATA)
    8. ]
    9. <note
    10.   <to>George</to
    11.   <from>John</from
    12.   <heading>Reminder</heading
    13.   <body>Don't forget the meeting!</body
    14. </note


    关于实体引用,转载了一篇文章解释的比较好:
    通过字符和实体引用,可以通过引用将信息加入 XML 文档,而不必直接在文档中键入字符。在下列情况下,这样做很有用:
    因为会被解释为标记,字符无法直接输入文档。
    因为输入设备的限制,字符无法直接输入文档。
    字符无法通过限于单字节字符的处理器可靠地传输。字符串或文档片断反复出现,并且可以缩写。为了显示内容,XML 提供了许多语法构造,以“and”符 (&) 开头,以分号 (;) 结尾。
    通过字符引用,可以插入通过指向 Unicode 代码点的数字标识的 Unicode 字符。代码点可以使用十进制或十六进制表示法标识。
    用于十进制引用的语法:    &#value;
    用于十六进制引用的语法:  &#xvalue;

    例如,要插入欧元符号,许多键盘上仍没有该字符,可以将 &#x20AC; 或 &#8364; 插入文档。
    下表为 XML 标记使用的字符列出了五种内置实体。实体 实体引用 含义

    实体实体引用含义
    lt
    &lt;
    <(小于号)
    gt
    &gt;
    >(大于号)
    amp
    &amp;
    &(“and”符)
    apos
    &apos;
    '(撇号或单引号)
    quot
    &quot;
    "(双引号)


    如果字符可能会使 XML 分析器错误地解释文档结构,请使用实体,而不要键入字符。&apos; 和 &quot; 实体引用最常用在属性值中。

     

     

    例一: 双引号的使用。

     

     

     

    双引号作为XML 属性值的开始结束符号,因此无法在值中直接使用"". 处理方式可以分为两种。

     

     

     a: 属性值中没有'(单引号) ,那么可以用单引号'' 作为属性值的开始结束符号

     

     

    <add key="IPhone" value="apple"/>  ...属性值为 ("apple").

     

     

    解决:  <add key="IPhone" value=’"apple"‘/> 

     

     

     b: 属性值中有'(单引号) ,也有双引号。 如...属性值为 ("'apple").

    <add key="IPhone" value="&quot;&apos;apple&quot;"/>  
  • 相关阅读:
    BZOJ 2876 骑行川藏
    BZOJ 2875 随机数生成器
    DT_修改注册项
    ip001
    ip
    阿里大鱼 阿里云api
    JS_全
    destoon框架二次开发【整理】
    destoon_笔记
    栏目class导航
  • 原文地址:https://www.cnblogs.com/keyi/p/6374478.html
Copyright © 2011-2022 走看看