Internel
基础
网络通信协议
计算机网络中实现通信必须有一些约定即通信协议,对速率、传输代码、代码结构、传输控制步骤、出错控制等制定标准。
常用协议
TCP/IP协议
-
TCP传输控制协议:TCP协议是一种可靠的端对端协议,重发一切没有收到的数据,进行数据内容准确性检查并保证分组的正确顺序。
-
IP网际协议:规定数据传输格式,IP协议的第四版IPv4
HTTP协议:超文本传输协议,基于请求和响应模式。
FTP协议:文件传输协议
SMTP协议:简单邮件传输协议
通信协议分层和OSI
为什么分层:由于结点之间联系很复杂,在制定协议时,把复杂成份分解成一些简单的成份,再将它们复合起来。最常用的复合方式是层次方式,即同层间可以通信、上一层可以调用下一层,而与再下一层不发生关系。
通信协议的分层规定: 把用户应用程序作为最高层,把物理通信线路作为最低层,将其间的协议处理分为若干层,规定每层处理的任务,也规定每层的接口标准。
OSI的七层模型
物理层(比特数据):传输比特流数据
数据链路层(帧数据):将网络层的数据进行分帧,每个帧包含地址、校验等信息。
网络层:通过IPv4协议确定计算机位置,即将网络地址翻译成对应的物理地址。
传输层:定义了一些数据传输的协议和端口号。将接收的数据进行分段和传输,到达目的地址后在进行重组。交流用(TCP/IP)协议
会话层:会话层建立、管理和终止表示层与实体之间的通信会话;
表示层:数据的解释、加密与解密、压缩与解压缩,以确保以一个系统应用层发送的信息可以被另一个系统应用层识别,即解决不同系统之间的应用程序的通信
应用层:终端应用程序提供服务。直接面对着用户的
网络通信接口
为了使两个结点(计算机)之间能进行对话,必须在它们之间建立通信工具(即接口)。接口包括两部分:
硬件:实现结点之间的信息传送
软件:规定双方进行通信的约定协议
补充概念
IP地址:32位(32bit),由4个8位的二进制数组成,每8位之间用圆点隔开
域名(Domain Address),即常说的网址,与IP地址间存在映射关系(由位于网络中的域名服务器DNS负责)
端口(port),逻辑意义上的数据传输通道、或是模拟通道。
Socket称为”套接字“,用于描述IP地址和端口,它是支持TCP/IP协议的网络通信的基本操作单元。有两种主要的操作方式:面向连接(TCP协议)和无连接(UDP协议)的。面向连接的操作比无连接操作的效率更低,但是数据的安全性更高。
TCP/IP 协议
没有照搬 OSI 模型,也没有一个公认的 TCP/IP 层级模型,一般划分为三层到五层。
三次握手:
客户端:可以对话吗?SYN=1
服务端:可以。SYN=1,ack
客户端:那开始对话吧。SYN=0,ack
四次挥手:
客户端:我说完了。FIN
服务端:知道了。ACK
服务端:我也说完了。FIN
客户端:知道了。ACK
HTTP
简介
HTTP(Hyper Text Transfer Protocol)超文本传输协议,用于从万维网服务器传输超文本到本地浏览器的传送协议;基于TCP/IP通信协议来传递HTML 文件, 图片文件, 查询结果等数据;属于应用层的面向对象的协议?。
工作:浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。Web服务器根据接收到的请求后,向客户端发送响应信息。
URL
HTTP使用统一资源标识符(Uniform Resource Identifiers, URI)来传输数据和建立连接。URL是一种特殊类型的URI,包含了用于查找某个资源的足够的信息。URL,全称是UniformResourceLocator, 中文叫统一资源定位符,是互联网上用来标识某一处资源的地址。
URL格式:<协议名><资源所在主机名>[:<端口号>]<资源名>
http://www.aspxfans.com:8080/news/index.asp?boardID=5&ID=24618&page=1#name
组成:
协议,域名或ip地址,[端口],[虚拟目录/news/],
[文件名,从域名后的最后一个“/”开始到“?”为止,是文件名部分,如果没有“?”,则是从域名后的最后一个“/”开始到“#”为止,是文件部分,如果没有“?”和“#”,那么从域名后的最后一个“/”开始到结束,都是文件名部分。本例中的文件名是“index.asp”]
[锚,从“#”开始到最后,都是锚部分。name]
参数:从“?”开始到“#”为止之间的部分为参数部分,又称搜索部分、查询部分。本例中的参数部分为“boardID=5&ID=24618&page=1”。参数可以允许有多个参数,参数与参数之间用“&”作为分隔符。
工作
步骤
1、客户端连接到Web服务器
一个HTTP客户端,通常是浏览器,向 DNS 服务器请求解析该 URL 中的域名所对应的 IP 地址,解析出 IP 地址后,根据该 IP 地址和默认端口 80,和Web服务器建立一个TCP套接字连接。
2、发送HTTP请求
通过TCP套接字,客户端向Web服务器发送一个文本的请求报文(详细看下面“请求”部分。)
3、服务器接受请求并返回HTTP响应
Web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,由客户端读取。(详细看下面“响应”部分。)
4、关闭或保持TCP连接
5、客户端浏览器解析HTML内容
客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码。然后解析每一个消息报头,消息报头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML,根据HTML的语法对其进行格式化,并在浏览器窗口中显示。
请求
客户端发送一个HTTP请求到服务器,该请求信息由请求行(request line)、请求头部(header)、空行和请求数据四部分组成。
GET /562f25980001b1b106000338.jpg HTTP/1.1(请求行,由请求类型,要访问的资源以及所使用的HTTP版本组成。)
Host img.mukewang.com (第二行开始为请求头部)
....
(空行)
(如果有的话为请求数据,如name=Professional%20Ajax&publisher=Wiley)
请求类型
Http1.0只有前三种。下面是1.1的内容。
GET 请求指定的页面信息,并返回实体主体。
HEAD 类似于get请求,只不过返回的响应中没有具体的内容,用于获取报头
POST 向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。
PUT 从客户端向服务器传送的数据取代指定的文档的内容。
DELETE 请求服务器删除指定的页面。
CONNECT HTTP1.1协议中预留给能够将连接改为管道方式的代理服务器。
OPTIONS 允许客户端查看服务器的性能。
TRACE 回显服务器收到的请求,主要用于测试或诊断。
响应
信息由状态行、消息报头、空行和响应正文组成。
HTTP/1.1 200 OK (状态行:HTTP协议版本号, 状态码, 状态消息)
Date: Fri, 22 May 2009 06:07:21 GMT (到空行前为消息报头,客户端要使用的一些附加信息)
Content-Type: text/html; charset=UTF-8
(空行)
<html> (响应正文)
<head></head>
<body>
<!--body goes here-->
</body>
</html>
状态码
1xx:指示信息--表示请求已接收,继续处理
2xx:成功--表示请求已被成功接收、理解、接受
3xx:重定向--要完成请求必须进行更进一步的操作
4xx:客户端错误--请求有语法错误或请求无法实现
5xx:服务器端错误--服务器未能实现合法的请求
具体
200 OK //客户端请求成功
400 Bad Request //客户端请求有语法错误,不能被服务器所理解
401 Unauthorized //请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
403 Forbidden //服务器收到请求,但是拒绝提供服务
404 Not Found //请求资源不存在,eg:输入了错误的URL
500 Internal Server Error //服务器发生不可预期的错误
503 Server Unavailable //服务器当前不能处理客户端的请求,一段时间后可能恢复正常
编程
Socket编程
两个进程间可以通过一个双向的网络通信连接实现数据交换,这种通信链路的端点被称为”套接字”(Socket)
Socket通常用来实现Client-Server连接
java.net包中定义的两个类Socket和ServerSocket,分别用来实现双向连接的client和server端。
Socket编程基本步骤
1.建立网络连接
2.打开连接到Socket的输入/输出流
3.通过已打开的I/O流进行数据读/写操作
4.关闭已打开的I/O流和Socket