zoukankan      html  css  js  c++  java
  • 使用Socket下载图片

    1. Socket下载一张图片
    2. Socket下载一页图片

    Socket下载一张图片

    在百度搜索头像,挑一张

     复制图片的路径打开,并保存这个url

    把这个url的域名和路径分开

     首先导入socket模块

     第一步:创建套接字客户端

     第二步:发起连接,connect()参数填域名和端口,http协议端口默认为80

     第三步:构造报文

     

    报文里的URL就是一开始从图片地址将域名和路径分出来的,然后将报文写在一行

     第四步:发送HTTP请求

     此时运行会报错

    因为Socket 发送和接收的都是bytes的数据,需要字节对象,现在的还是字符串,通过encode()编码

     第五步:循环接收响应的内容

     因为不知道响应的内容具体有多少,每次从管道中取出1024字节,取完为止,然后可以打印出res,看看接收到的数据

     第六步:通过正则匹配图片的内容(去掉响应头)

     这个也得用bytes的数据去匹配,匹配完返回的类型是一个列表

    最后一步:把图片写入到本地

     图片的内容本身就是二进制,就不用decode()解码了

    Socket下载一页图片

    依然选择的是头像这个网页,这次不用选择图片,直接把这一页的全给下载到本地

    复制这个网页的路径,并保存这个URL

    第一步:把网页的url赋值给一个变量保存,为方便后续识别,可以在注释里把域名和路径区分开

    第二步:写一个方法,方便多次使用(跟上面下载一张图片的步骤一样)

    第三步:构造报文(报文里的路径是刚才在注释里为方便识别而区分开的),将域名和报文传入这个方法,打印显示接收到的内容,返回的是bytes类型,打印的时候需要decode()

     这时,你会发现,这响应的内容就是网页的源代码

     第四步:这时,需要到网页里去寻找出图片的url,知道url才知道下载的东西在哪里

     复制URL到网页的源代码中搜索,找到三个URL

     每个url前都有一个不同的参数,需要下载一页图片,就要知道所有图片的url的共同点,把这三个参数分别去搜索了一下,发现,都有30次的出现,这就能确定是所有图片url都带有的了

     

     

     第五步:找到url的特点后,我们可以通过正则在返回的源码中匹配出所有图片的url

     最后一步:通过for迭代,依次对列表里的url进行下载

     

     这时,每张图片的url的已经出来了,接下来就是跟上面下载一张图片一样的操作了

     现在运行就搞定了

     

  • 相关阅读:
    thymeleaf是用于编写html模版的编程语言(工具语言)
    前端页面生成技术
    算法是用逻辑语言描述的问题求解步骤
    模板引擎
    递归与分形
    泛型的特征-为什么使用泛型(集合理论)
    算法沉思录-算法的描述(草稿)
    计算机语言发展史
    pHP生成唯一单号
    laravel实现批量添加数据
  • 原文地址:https://www.cnblogs.com/jiyu-hlzy/p/11746292.html
Copyright © 2011-2022 走看看