zoukankan      html  css  js  c++  java
  • 爬虫基础URL

    转载自:https://blog.csdn.net/weixin_42830697/article/details/102490400

    URL遵守以下的语法规则:

    scheme://host:port/path/?query-string=xxx#anchor
    各个部分解释如下:

    scheme - 定义因特网服务的类型(访问因特网的协议)。常见的协议有 http、https、ftp、file。
    host - 主机名,域名(比如:www.baidu.com)
    port - 定义主机上的端口号(http 的默认端口号是 80 ||| https 的默认端口号为443)
    path - 定义服务器上的路径(如果省略,则文档必须位于网站的根目录中)。比如:https://blog.csdn.net/weixin_42830697/article/details/100055764【标红部分为路径】
    query-string - 定义文档/资源的名称。比如查找猫:https://www.baidu.com/s?&wd=猫
    anchor-网页锚点,前端用来做网页定位。【不用管】
    解释:

    (1)常见的协议:

    <1>HTTP协议:超文本传输协议,是一种发布和接收HTML页面的协议。默认服务端口为80端口。也就是说,如果想利用互联网进行html页面的传输,必须遵从此协议。

    <2>HTTPS协议:是HTTP协议的加密版本,在HTTP下加入了SSL层。默认服务端口为443端口。

    <3>FTP协议:文件传输协议。

    <4>FILE协议:本地文件传输协议。
    ————————————————
    版权声明:本文为CSDN博主「Python伊甸园」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/weixin_42830697/article/details/102490400

  • 相关阅读:
    从0开始学习ssh之搭建环境
    yii2-user 一个好用的用户扩展
    yii2下使用支付宝
    SQL迅速增加表中记录语句
    浅谈Java分页技术
    浅谈JavaWEB入门必备知识之Servlet入门案例详解
    CSS控制之IE常见BUG及解决方案
    Java-Swing编程之对话框案例详解
    浅谈Java工具类CommonUtils的使用
    浅谈Log4j
  • 原文地址:https://www.cnblogs.com/JunCen/p/13184247.html
Copyright © 2011-2022 走看看