什么是爬虫?
从互联网的一些相关网站获得一些相关公布在网页上展现的数据,一种免费获取数据的方式,,但商家并不希望有人获取该数据,会反爬虫
获得哪些数据?
图片,视频,文字信息
购物网站:商品图片 商品名字 商品价格 商品描叙 商品评价数 商店名字
爬虫运行的逻辑?
1. 获取html页面
2. 解析页面
3. 获取内容,写入文件或存入数据库
4. 获取内容的展示