从百度图片下载一些图片当做训练集,好久没写爬虫,生疏了。没有任何反爬,随便抓。
网页:
动态加载,往下划会出现更多的图片,一次大概30个。先找到保存每一张图片的json,其对应的url:
打开调试,清空,然后往下划。然后出现:
点击左侧的链接,出现右边的详细信息,对应的就是URL。对这个url做请求即可。以下是代码:
# -*- coding: utf-8 -*- # import tensorflow as tf # import os # import numpy as np import requests import my_fake_useragent as ua import re import random # 蓝色背景 def blue_print(*s, end=' '): for item in s: print('