zoukankan      html  css  js  c++  java
  • python-获取网页源码及保存网页图片到本地实例

    功能描述:

    使用python获取目标网页的源码及保存网页图片保存到本地

    代码:

     1 import re
     2 import urllib
     3 import sys
     4 
     5 
     6 #获取页面源码
     7 
     8 def getHtml(url):
     9       page=urllib.urlopen(url)   # 打开页面
    10       html = page.read()       #获取目标页面的源码
    11       return html
    12 
    13 #获取页面中的图片地址
    14 
    15 def getImg(html):
    16       reg=r'src="(.+?.png)"'     #正则表达是筛选图片格式
    17       img = re.compile(reg)       #创建模式对象
    18       imglist = re.findall(img,html)   #解析页面源码获取图片列表
    19       x=0
    20       for imgurl in imglist:
    21            try:
    22                 imgurl1=url+imgurl      
    23                 #由于获取的地址不带域名信息,所以拼接上域名
    24                 urllib.urlretrieve(imgurl1,'%s.png' % x)  
    25                  # 保存图片,进行重命名
    26             except:
    27                 print('Unexpected error:',sys.exc_info())
    28        return imglist
    29 
    30 #调用方法
    31 
    32 url = “http://www.zjgdpf.org.cn”
    33 html = getHtml(url)
    34 print(html)
    35 print(getImg(html))
  • 相关阅读:
    2020.12.17
    2020.12.16
    2020.12.15
    2020.12.13
    JavaScript变量:
    第二十七章 ansible变量介绍
    今日收获
    今日收获
    今日收获
    今日收获
  • 原文地址:https://www.cnblogs.com/Annaying/p/7872810.html
Copyright © 2011-2022 走看看