zoukankan      html  css  js  c++  java
  • python-day1 爬虫基础之HTTP基本原理

    经过前几天的开发环境配置,今天终于正式开启学Python之路了,今天主要看了HTTP的基本原理,下边做一个总结:

    1.首先要了解的就是URI和URL,URI的全拼是Uniform Resource Identifier,也就是统一资源标志符;URL的全拼是Uniform Resource Locator,也就是统一资源定位符;我对这两个名称的理解就是 两者都基本可以称之为网页链接,也就是我们通常说的网址。除此之外,还有一个URN,其全拼是Uniform Resource Name,也就是统一资源名称;不过,URN现在我们用的比较少。

    2.还需要了解一个概念,就是超文本——hypertext,我对超文本的总结就是一个词——网页源代码,我们看到的网页内容,其实就是由超文本解析而成的,这里还涉及到一个词,叫做HTML,这个词大家都应该见过,网页源代码就是HTML代码,在HTML代码里边会包含一系列的标签,比如说,像我们熟悉的img,它在HTML源代码里就代表图片,除此之外还有“p”代表指定显示段落。举个例子,我们打开一个网页,鼠标右击,选择“审查元素”,在Elements即可看到网页的源代码,如下图所示:

    3.经常上网的朋友,肯定能注意到,网址的最前边有时候是http,有时候是https,在我看来两者的区别就是,https更安全一些,它是有CA机构颁发的安全签章的,所以安全系数比较高。

    4.我们在输入网址进入网页的过程,其实是浏览器向服务器发送了一个请求,服务器在接收到请求指令后,会做出一系列的响应,并将其响应传回给浏览器,浏览器对响应进行解析处理后,将网页内容呈现在我们眼前。需要说的是,服务器所返回的响应中就包含网页的源代码。

    以上就是今天所学,因为白天还有其他的事情要做,只有晚上才有时间学一会python,如有不对的地方,还希望能积极指正,万分感谢,一起学习,共同进步。

  • 相关阅读:
    VS2010 配置驱动开发环境
    C函数调用与入栈顺序
    Ecshop后台流量分析地区分布的地名全是乱码
    使用.net程序发送邮件代码
    齐博系统出现此文件不可写:cache/label_cache/index_0_8_0_0_1_6539c.php
    UCHOME中链接前多了link.php?url=,如何去除
    discuz7.2 修改数据调用中日期格式
    php设置和获取cookie
    删除数据库所有存储过程的SQL语句
    docker搭建skywalking 8.7简明笔记 海口
  • 原文地址:https://www.cnblogs.com/jiangtongxue/p/9374763.html
Copyright © 2011-2022 走看看