很多时候想爬取网页信息,结果出现URL是中文的情况(比如‘耳机'),url的地址编码却是%E8%80%B3%E6%9C%BA,因此需要做一个转换。这里我们就用到了模块urllib。
代码超简单
1 #-*- coding:utf-8 -*- 2 import urllib 3 data = '耳机' 4 print data 5 print urllib.quote(data) 6 7 结果; 8 耳机 9 %E8%80%B3%E6%9C%BA 10 [Finished in 0.1s]
如果想换回去,用urllib.unquote()就可以了