zoukankan      html  css  js  c++  java
  • gzip 压缩格式的网站处理方法---sina.com 分类: python python基础学习 2013-07-16 17:40 362人阅读 评论(0) 收藏

    gzip 压缩格式的网站处理方法---sina.com


    1. #coding:utf-8
    2. import urllib2
    3. import re
    4. import zlib
    5. url_address = 'http://www.sina.com.cn'
    6. f = urllib2.urlopen(url_address)
    7. buf = f.read()
    8. buf = zlib.decompress(buf, 16+zlib.MAX_WBITS);
    9. #buf = buf.replace(" ","")
    10. print buf

    练习:

    #coding:utf-8

    import urllib2 import zlib def main():     request = urllib2.urlopen('http://www.sina.com.cn')     print request.headers.get('Content-Encoding')#获得编码格式         buf = request.read()     buf = zlib.decompress(buf, 16+zlib.MAX_WBITS)     print buf if __name__ == '__main__':     main()

    方法二:

    #coding:utf-8 import urllib2,StringIO,gzip f = urllib2.urlopen('http://www.sina.com.cn') print f.headers compressdata = f.read() compressdata = StringIO.StringIO(compressdata) gzipper = gzip.GzipFile(fileobj=compressdata) data = gzipper.read() print data

  • 相关阅读:
    第二周作业
    7-2 求最大值及其下标
    第十一周作业
    第九周编程总结
    第八周作业
    第七周作业
    第六周作业
    第五周作业
    第4周作业
    第三周作业
  • 原文地址:https://www.cnblogs.com/think1988/p/4628125.html
Copyright © 2011-2022 走看看