Python处理转义字符--HTMLParse安装及相关错误 - 走看看

zoukankan html css js c++ java

Python处理转义字符--HTMLParse安装及相关错误
网页数据中包含&, >, <,  等转义字符，想要将他们变成&<> 原字符

例如：
html = '<content>
python处理方式
import HTMLParser html_parser = HTMLParser.HTMLParser() txt = html_parser.unescape(html) #这样就得到了txt = '<content>'
转回转义字符
import cgi html = cgi.escape(txt) # 这样又回到了 html = '<content&gt'
当我们pip安装HTMLParser并且按照上述方式写到代码里时，会报错

ModuleNotFoundError: No module named 'markupbase

OK，那我们继续pip安装markupbase，哎，提示不行啊，于是官网下载https://pypi.org/project/micropython-_markupbase/#description

两次解压后得到文件夹micropython-_markupbase-3.3.3-1，然后在python的路径中找到site-packages这个文件夹，将micropython-_markupbase-3.3.3-1这个包中_markupbase.py文件改名为markupbase.py并放到site-packages文件夹中。！！！只放一个.py文件其他不要，不然会报错。

重新运行程序，果不其然依然报错啊！

ModuleNotFoundError: No module named 'htmlentitydefs'

然后将导包的方式换一下：
from HTMLParser import HTMLParser #python2 from html.parser import HTMLParser #python3

html_parser = HTMLParser() txt = html_parser.unescape(html) #这样就得到了txt = '<content>'
大功告成！
查看全文

相关阅读:
比较器 Comparable 与compartor 的区别及理解
 事务特性、事务隔离级别、spring事务传播特性
 分布式文件上传-FastDFS
spring-cloud 组件总结以及搭建图示（六）
springCloud zuul网关（五）
hashCode与equals 通过面试题一窥究竟
 【原】那年30岁
 【原】Hyper-V虚拟机设置外部网络访问
 【原】win10 .net framework 3.5安装
 【原】做梦有感

原文地址：https://www.cnblogs.com/QRain/p/14869699.html

Copyright © 2011-2022 走看看