zoukankan      html  css  js  c++  java
  • Python实战:美女图片下载器,海量图片任你下载

    Python应用现在如火如荼,应用范围很广。因其效率高开发迅速的优势,快速进入编程语言排行榜前几名。本系列文章致力于可以全面系统的介绍Python语言开发知识和相关知识总结。希望大家能够快速入门并学习Python这门语言。

    本文是在前一部分Python基础之上Python实战:Python爬虫学习教程,获取电影排行榜,再次升级的Python网页爬虫实战课程。

    1.项目概述。

    利用XPath和requests模块进行网页抓取与分析,达到网页图片下载的效果。

    抓爬图片地址:http://www.2cto.com/meinv/

    开发环境:python 2.7、PyCharm 5 Community

    所需知识:神器XPath、Requests模块、Python基本语法。

    2.所需模块介绍及安装

    1. Xpath

      1. 介绍:XPath其实是一门可以在XML中通过元素的属性进行查找提取信息的一门语言。它支持HTML。

      2. 与正则表达式相比,更简单。更强大

      3. 安装:下载lxml库进行安装操作。下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml。下载对应版本的lxml

      4. 打开库目录运行命令进行安装

        1. 下载完成之后,请把后缀名whl改为zip。

        2. 解压文件把lxml文件夹放入python安装目录的lib文件夹下。

    2. Requests模块安装

      1. 具体详细安装步骤请参阅:Python实战:Python爬虫学习教程,获取电影排行榜 中requests的安装。

    3.Xpath提取查找内容详解:

    是语言都不例外,Xpath也有一定语法。

    // 定位根节点

    / 往下层寻找

    /text() 提取文本内容

    /@xxx 提取属性内容

    4.项目主体代码

    1. from lxml import etree

    2. selector = etree.HTML(网页源代码)

    3. selector.xpath(xpath语法)

    4. import requests

    5. requests.get(url)

    5.代码演示:

    Python实战:美女图片下载器,海量图片任你下载效果展示:

    Python实战:美女图片下载器,海量图片任你下载

    小技巧:xpath简单获取:开发人员工具-定位要提取的标签-右键如图所示可以复制xpath路径。

    但尚需修改哦。

    Python实战:美女图片下载器,海量图片任你下载

    欢迎关注今日头条:做全栈攻城狮。Python实战:美女图片下载器,海量图片任你下载。

    QQ技术交流群: 538742639

    项目源码请关注微信公众平台:fullstackcourse 做全栈攻城狮。回复:"美女图片下载器"获取。

    下篇:Python学习入门教程,字符串函数扩充详解

  • 相关阅读:
    Hrbust-1492 盒子(二分图最大匹配)
    数据结构——二叉树的建立和遍历(递归建树&层序遍历建树)
    HDU 1710 二叉树遍历
    HDU 2891
    HDU 2895 贪心 还是 大水题
    POJ 2896 另解暴力
    POJ 2896 AC自动机 or 暴力
    HDU 1714 math
    POJ 1328 贪心
    POJ 2109 巧妙解法
  • 原文地址:https://www.cnblogs.com/happpytoo/p/5936761.html
Copyright © 2011-2022 走看看