zoukankan html css js c++ java

通过python的urllib.request库来爬取一只猫

我们实验的网站很简单，就是一个关于猫的图片的网站：http://placekitten.com

代码如下：

import urllib.request

respond = urllib.request.urlopen("http://placekitten.com.s3.amazonaws.com/homepage-samples/200/287.jpg")
cat_img = respond.read()
f = open('cat_200_300.jpg','wb')
f.write(cat_img)

结果便会在代码存放的路径上生成这个jpg文件了，可爱的小猫咪。

这个例子很简单，以后会有更加厉害的爬虫。

/*************************************************************************/

稍微较大的爬取一些有相关关联的jpg格式的图片

import urllib.request

#http://placekitten.com.s3.amazonaws.com/homepage-samples/200/140.jpg
img = [287,140,139,286,138]
for num in img:
    cont = urllib.request.urlopen("http://placekitten.com.s3.amazonaws.com/homepage-samples/200/"+str(num)+".jpg")
    picture = cont.read()
    f = open('C:/Users/lenovo/Desktop/cat_picture/cat_img'+str(num)+'.jpg','wb')
    f.write(picture)

这样就在我指定的文件夹里面生成了我爬取的jpg图片了

查看全文

相关阅读:
2.9数据-paddlepaddle数据集wmt16
2.8数据-paddlepaddle数据集uci_housing
2.6数据-paddlepaddle数据集movielens
2.5数据-paddlepaddle数据集imikolov
2.4数据-paddlepaddle数据集imdb
2.3数据-paddlepaddle数据集Conll05
在android程序中怎么执行ifconfig命令来修改android 的ip地址，
VMware 11安装Mac OS X 10.10 及安装Mac Vmware Tools.
xcode7 如何真机测试
 海子

原文地址：https://www.cnblogs.com/jeavenwong/p/6906287.html