zoukankan      html  css  js  c++  java
  • python 网页抓取并保存图片

    #-*-coding:utf-8-*-
    
    import os
    import uuid
    import urllib2
    import cookielib
    
    '''获取文件后缀名'''
    def get_file_extension(file): 
    return os.path.splitext(file)[1]
    
    '''創建文件目录,并返回该目录'''
    def mkdir(path):
    # 去除左右两边的空格
    path=path.strip()
    # 去除尾部 符号
    path=path.rstrip("\")
    
    if not os.path.exists(path):
    os.makedirs(path)
    
    return path
    
    '''自动生成一个唯一的字符串,固定长度为36'''
    def unique_str():
    return str(uuid.uuid1())
    
    '''
    抓取网页文件内容,保存到内存
    
    @url 欲抓取文件 ,path+filename
    '''
    def get_file(url):
    try:
    cj=cookielib.LWPCookieJar()
    opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
    urllib2.install_opener(opener)
    
    req=urllib2.Request(url)
    operate=opener.open(req)
    data=operate.read()
    return data
    except BaseException, e:
    print e
    return None
    
    '''
    保存文件到本地
    
    @path 本地路径
    @file_name 文件名
    @data 文件内容
    '''
    def save_file(path, file_name, data):
    if data == None:
    return
    
    mkdir(path)
    if(not path.endswith("/")):
    path=path+"/"
    file=open(path+file_name, "wb")
    file.write(data)
    file.flush()
    file.close()
    
    
    #获取文件后缀名
    print get_file_extension("123.jpg");
    
    #創建文件目录,并返回该目录
    #print mkdir("d:/ljq")
    
    #自动生成一个唯一的字符串,固定长度为36
    print unique_str()
    
    url="http://qlogo1.store.qq.com/qzone/416501600/416501600/100?0";
    save_file("d:/ljq/", "123.jpg", get_file(url))

    转自:http://www.cnblogs.com/linjiqin/p/3672285.html

    每天一小步,人生一大步!Good luck~
  • 相关阅读:
    java利用透明的图片轮廓抠图
    java单例之enum实现方式
    spring之ControllerAdvice注解
    memcached命令
    2016年开源巨献:来自百度的71款开源项目
    dubbo通信协议之对比
    Elasticsearch权威指南(中文版)
    Apache shiro之权限校验流程
    简单的freemarker解析测试
    Apache shiro之身份验证(登陆)流程
  • 原文地址:https://www.cnblogs.com/jkmiao/p/4750364.html
Copyright © 2011-2022 走看看