对于urllib中我们先需要导入你想实用的类
import urllib
一般需要爬取信息等
import urllib.request
或 from urllib import request ,当程序导入完
我们先说说 urllib 下一些常用的方法吧
比如说:
urllib.request.urlopen("网页路径")
urllib.request.uropen("网页路径",timeout="设置爬取时间")
//这一般是读取你需要的网页页面信息
urllib.request.urlretrieve("网页地址",filename="本地磁盘地址")
//把你需要的网页信息爬在本地磁盘
urllib.request.urlcleanup()
//清除爬取缓存 是什么意思呢?就比如说你要爬取网页到自己磁盘本地时,缓存中就存在的操作进行清除
n.info()
//查看你网页的环境信息
getcode() //返回当前网页的状态
geturl()//查看网页地址