zoukankan      html  css  js  c++  java
  • urllib 库的基础和实用(1)

    对于urllib中我们先需要导入你想实用的类

     import urllib

     一般需要爬取信息等

    import urllib.request

    或 from urllib import request ,当程序导入完

    我们先说说 urllib 下一些常用的方法吧

    比如说:

            urllib.request.urlopen("网页路径")

            urllib.request.uropen("网页路径",timeout="设置爬取时间")

    //这一般是读取你需要的网页页面信息

           urllib.request.urlretrieve("网页地址",filename="本地磁盘地址")

     //把你需要的网页信息爬在本地磁盘

           urllib.request.urlcleanup()

    //清除爬取缓存 是什么意思呢?就比如说你要爬取网页到自己磁盘本地时,缓存中就存在的操作进行清除

    n.info()

    //查看你网页的环境信息

    getcode()  //返回当前网页的状态

    geturl()//查看网页地址

  • 相关阅读:
    闰年的定义
    Sublime Text 3
    维特比算法(Viterbi)
    索引
    倒排索引
    URL过滤
    判断一个元素是否在集合中
    布隆过滤器
    jsp九大内置对象
    jsp九大内置对象和其作用详解
  • 原文地址:https://www.cnblogs.com/chunqing/p/9055180.html
Copyright © 2011-2022 走看看