zoukankan      html  css  js  c++  java
  • gzip 压缩格式的网站处理方法---sina.com 分类: python python基础学习 2013-07-16 17:40 362人阅读 评论(0) 收藏

    gzip 压缩格式的网站处理方法---sina.com


    1. #coding:utf-8
    2. import urllib2
    3. import re
    4. import zlib
    5. url_address = 'http://www.sina.com.cn'
    6. f = urllib2.urlopen(url_address)
    7. buf = f.read()
    8. buf = zlib.decompress(buf, 16+zlib.MAX_WBITS);
    9. #buf = buf.replace(" ","")
    10. print buf

    练习:

    #coding:utf-8

    import urllib2 import zlib def main():     request = urllib2.urlopen('http://www.sina.com.cn')     print request.headers.get('Content-Encoding')#获得编码格式         buf = request.read()     buf = zlib.decompress(buf, 16+zlib.MAX_WBITS)     print buf if __name__ == '__main__':     main()

    方法二:

    #coding:utf-8 import urllib2,StringIO,gzip f = urllib2.urlopen('http://www.sina.com.cn') print f.headers compressdata = f.read() compressdata = StringIO.StringIO(compressdata) gzipper = gzip.GzipFile(fileobj=compressdata) data = gzipper.read() print data

  • 相关阅读:
    Django框架基础之序列化
    资产采集
    CMDB
    数据库--三层架构
    Django 项目一补充
    评论楼
    图片预览
    验证码
    如何使用C/C++动态库与静态库中的宏
    Matlab 直线方程、采样函数
  • 原文地址:https://www.cnblogs.com/think1988/p/4628125.html
Copyright © 2011-2022 走看看