zoukankan      html  css  js  c++  java
  • xml.sax 笔记

    from xml.sax import saxutils
    html_str = """<!DOCTYPE html>
    <html>
    <head>
      <title>name</title>
    </head>
    <body>
    <h1>namejr</h1>
    <p>my name is namejr</p>
    <span>my age is <b>22</b> years old</span>
    <p>other string, such as "*", "@"</p>
    </body>
    </html>"""
    
    # xml.sax.saxutils.escape(data[, entities={}])将html代码进行转义
    
    # xml.sax.saxutils.escape(data)  # 按照规定的进行转义,转义的内容:"<"/">"/"&" 对应"&lt;"/"&gt;"/"&amp;"
    print(saxutils.escape(html_str))
    """
    D:笔记python电子书Python3>python index.py
    &lt;!DOCTYPE html&gt;
    &lt;html&gt;
    &lt;head&gt;
      &lt;title&gt;name&lt;/title&gt;
    &lt;/head&gt;
    &lt;body&gt;
    &lt;h1&gt;namejr&lt;/h1&gt;
    &lt;p&gt;my name is namejr&lt;/p&gt;
    &lt;span&gt;my age is &lt;b&gt;22&lt;/b&gt; years old&lt;/span&gt;
    &lt;p&gt;other string, such as "*", "@"&lt;/p&gt;
    &lt;/body&gt;
    &lt;/html&gt;
    """
    
    # 如果想转义自己定义的字符就要使用到entities参数
    entities = {'*':'不知道写啥', '@':'更不知道写啥'}
    print(saxutils.escape(html_str, entities=entities))
    """
    D:笔记python电子书Python3>python index.py
    &lt;!DOCTYPE html&gt;
    ...
    &lt;span&gt;my age is &lt;b&gt;22&lt;/b&gt; years old&lt;/span&gt;
    &lt;p&gt;other string, such as "不知道写啥", "更不知道写啥"&lt;/p&gt;
    &lt;/body&gt;
    &lt;/html&gt;
    """
    # xml.sax.saxutils.unescape()  # 与xml.sax.saxutils.escape()相反

     

    xml.sax.saxutils.quoteattr()

    from xml.sax import saxutils
    # xml.sax.saxutils.quoteattr() 与escape()相似,区别是quoteattr()将根据数据的内容选择引号,试图避免对字符串中的任何引号进行编码(只使用一种引号不编码,如果单双引号都在使用,会对双引号进行编码)
    html_str = "<element attr={}>".format(saxutils.quoteattr("ab' cd"ef"))
    print(html_str)
  • 相关阅读:
    matrix_last_acm_4
    matrix_last_acm_3
    matrix_last_acm_2
    matrix_last_acm_1
    2015亚洲区北京站网络赛
    poj 1062 昂贵的聘礼 最短路
    2-SAT !!
    hdu 4925
    hdu 4927 Java大数
    poj3687 拓扑排序 还没怎么搞明白 回头再想想
  • 原文地址:https://www.cnblogs.com/namejr/p/10004472.html
Copyright © 2011-2022 走看看