zoukankan      html  css  js  c++  java
  • socket 套接字

    套接字基础

    c/s架构        client ---------internet------------server
    server端:
    力求一直提供服务
    要绑定一个唯一的地址,让客户端能够明确的找到

    为何学习socket一定要先学习互联网协议

    1.首先:本节课程的目标就是教会你如何基于socket编程,来开发一款自己的C/S架构软件

    2.其次:C/S架构的软件(软件属于应用层)是基于网络进行通信的

    3.然后:网络的核心即一堆协议,协议即标准,你想开发一款基于网络通信的软件,就必须遵循这些标准。

         TCP/IP协议族包括传输层、网络层、链路层


    Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,
    它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。
    所以,我们无需深入理解tcp/udp协议,socket已经为我们封装好了,我们只需要遵循socket的规定去编程,
    写出的程序自然就是遵循tcp/udp标准的。

    通俗理解
    socket=ip+port,ip是用来标识互联网中的一台主机的位置,而port是用来标识这台机器上的一个应用程序,ip地址是配置到网卡
    上的,而port是应用程序开启的,ip与port的绑定就标识了互联网中独一无二的一个应用程序
    标准定义:源IP地址和目的IP地址以及源端口号和目的端口号的组合称为套接字。其用于标识客户端请求的服务器和服务。
    套接字发展史及分类

    套接字起源于 20 世纪 70 年代加利福尼亚大学伯克利分校版本的 Unix,即人们所说的 BSD Unix。 因此,有时人们也把套接字称为“伯克利套接字”或“BSD 套接字”。一开始,套接字被设计用在同 一台主机上多个应用程序之间的通讯。这也被称进程间通讯,或 IPC。套接字有两种(或者称为有两个种族),分别是基于文件型的和基于网络型的。 

    基于文件类型的套接字家族

    套接字家族的名字:AF_UNIX

    unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成通信

    基于网络类型的套接字家族

    套接字家族的名字:AF_INET

    (还有AF_INET6被用于ipv6,还有一些其他的地址家族,不过,他们要么是只用于某个平台,要么就是已经被废弃,或者是很少被使用,或者是根本没有实现,所有地址家族中,AF_INET是使用最广泛的一个,python支持很多种地址家族,但是由于我们只关心网络编程,所以大部分时候我么只使用AF_INET)


    socket工作流程
    先从服务器端说起。服务器端先初始化Socket,然后与端口绑定(bind),对端口进行监听(listen),调用accept阻塞,等待客户端连接。
    在这时如果有个客户端初始化一个Socket,然后连接服务器(connect),如果连接成功,这时客户端与服务器端的连接就建立了。
    客户端发送数据请求,服务器端接收请求并处理请求,然后把回应数据发送给客户端,客户端读取数据,最后关闭连接,一次交互结束。

    基于tcp协议的套接字
     1 #基于tcp的服务端
     2 import socket
     3 phone = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
     4 phone.setsockopt(socket.SOL_SOCKET,socket.SO_REUSEADDR,1)
     5 phone.bind(('127.0.0.1',8080))
     6 phone.listen(5)
     7 
     8 print('start.....')
     9 while True:#链接循环        一台客户端中断链接时,不至于服务端也停止运行
    10     conn,addr = phone.accept()       #等待电话链接
    11     print('电话线路是',conn)
    12     print('客户端手机号',addr)
    13     while True:# 通信循环
    14         try:         #应对windows系统
    15             #print("等待接收")
    16             data = conn.recv(1024)
    17             if not data : break           #应对linux系统  #如果不加,那么正在链接的客户端突然断开,recv便不再阻塞,死循环发生
    18             print('客户端发来的消息',data.decode('utf8'))
    19             s =  input("....")
    20             conn.send(s.encode('utf8'))
    21         except Exception:
    22             break
    23     conn.close()
    24 phone.close()
    View Code
     1 #基于tcp的客户端
     2 import socket
     3 phone = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
     4 phone.connect(('127.0.0.1',8080))
     5 
     6 while True:
     7     msg = input('>> :').strip()
     8     if not msg: continue
     9     phone.send(msg.encode('utf8'))
    10     print('has send=========>')
    11     data = phone.recv(1024)
    12     print('has recv==========>')
    13     print(data)
    14 
    15 
    16 phone.close()
    View Code
    1.tcp协议

    (1)如果收消息缓冲区里的数据为空,那么recv就会阻塞(阻塞很简单,就是一直在等着收)

    (2)只不过tcp协议的客户端send一个空数据就是真的空数据,客户端即使有无穷个send空,也跟没有一个样。

    (3)tcp基于链接通信

    基于链接,则需要listen(backlog),指定半连接池的大小
    基于链接,必须先运行的服务端,然后客户端发起链接请求
    对于mac系统:如果一端断开了链接,那另外一端的链接也跟着完蛋recv将不会阻塞,收到的是空(解决方法是:服务端在收消息后加上
    if判断,空消息就break掉通信循环)
    对于windows/linux系统:如果一端断开了链接,那另外一端的链接也跟着完蛋recv将不会阻塞,收到的是空(解决方法是:服务端通信
    循环内加异常处理,捕捉到异常后就break掉通讯循环)
    基于udp协议的套接字(QQ聊天)
    #基于udp的服务端
    from socket import *
    ip_port = ('127.0.0.1',8080)
    Bufsize = 1024
    t = socket(AF_INET,SOCK_DGRAM)
    t.bind(ip_port)
    while True:
        msg,addr = t.recvfrom(Bufsize)
        print(msg.decode('utf8'),addr)
        msg = input('>> :').strip()
        t.sendto(msg.encode('utf8'),addr)
    View Code
     1 #基于udp的客户端
     2 from socket import *
     3 ip_port = ('127.0.0.1',8080)
     4 Bufsize = 1024
     5 t = socket(AF_INET,SOCK_DGRAM)
     6 
     7 
     8 while True:
     9     msg = input('>>:').strip()
    10     # if not msg:continue
    11     t.sendto(msg.encode('utf8'),ip_port)
    12 
    13     back_msg,addr = t.recvfrom(Bufsize)
    14     print(back_msg.decode('utf8'),addr)
    15 
    16 # send(bytes_data):发送数据流,数据流bytes_data若为空,自己这段的缓冲区也为空,操作系统不会控制tcp协议发空包
    17 # sendinto(bytes_data,ip_port):发送数据报,bytes_data为空,还有ip_port,所有即便是发送空的bytes_data,数据报其实也
    18 # 不是空的,自己这端的缓冲区收到内容,操作系统就会控制udp协议发包。
    View Code
    2.udp协议

    (1)如果如果收消息缓冲区里的数据为“空”,recvfrom也会阻塞

    (2)只不过udp协议的客户端sendinto一个空数据并不是真的空数据(包含:空数据+地址信息,得到的报仍然不会为空),所以客户端
    只要有一个sendinto(不管是否发送空数据,都不是真的空数据),服务端就可以recvfrom到数据。

    (3)udp无链接

    无链接,因而无需listen(backlog),更加没有什么连接池之说了
    无链接,udp的sendinto不用管是否有一个正在运行的服务端,可以己端一个劲的发消息,只不过数据丢失
    recvfrom收的数据小于sendinto发送的数据时,在mac和linux系统上数据直接丢失,在windows系统上发送的比接收的大直接报错
    只有sendinto发送数据没有recvfrom收数据,数据丢失
    服务端套接字函数
    s.bind() 绑定(主机,端口号)到套接字
    s.listen() 开始TCP监听
    s.accept() 被动接受TCP客户的连接,(阻塞式)等待连接的到来

    客户端套接字函数
    s.connect() 主动初始化TCP服务器连接
    s.connect_ex() connect()函数的扩展版本,出错时返回出错码,而不是抛出异常

    公共用途的套接字函数
    s.recv() 接收TCP数据
    s.send() 发送TCP数据(send在待发送数据量大于己端缓存区剩余空间时,数据丢失,不会发完)
    s.sendall() 发送完整的TCP数据(本质就是循环调用send,sendall在待发送数据量大于己端缓存区剩余空间时,数据不丢失,循环调用send直到发完)
    s.recvfrom() 接收UDP数据
    s.sendto() 发送UDP数据
    s.getpeername() 连接到当前套接字的远端的地址
    s.getsockname() 当前套接字的地址
    s.getsockopt() 返回指定套接字的参数
    s.setsockopt() 设置指定套接字的参数
    s.close() 关闭套接字

    面向锁的套接字方法
    s.setblocking() 设置套接字的阻塞与非阻塞模式
    s.settimeout() 设置阻塞套接字操作的超时时间
    s.gettimeout() 得到阻塞套接字操作的超时时间

    面向文件的套接字的函数
    s.fileno() 套接字的文件描述符
    s.makefile() 创建一个与该套接字相关的文件


    粘包现象
     
    两种情况下会发生粘包
    11发送端需要等缓冲区满才发送出去,造成粘包(发送数据时间间隔很短,数据了很小,会合到一起,产生粘包)
    22接收方不及时接收缓冲区的包,造成多个包接收(客户端发送了一段数据,服务端只收了一小部分,服务端下次再收的时候还是从
    缓冲区拿上次遗留的数据,产生粘包)

    粘包发生的原因:发消息,都是将数据发送到己端的发送缓冲中,收消息都是从己端的缓冲区中收

    TCP(transport control protocol,传输控制协议)是面向连接的,面向流的,提供高可靠性服务。收发两端(客户端和服务器端)都
    要有一一成对的socket,因此,发送端为了将多个发往接收端的包,更有效的发到对方,使用了优化方法(Nagle算法),将多次间隔较
    小且数据量小的数据,合并成一个大的数据块,然后进行封包。这样,接收端,就难于分辨出来了,必须提供科学的拆包机制。
    即面向流的通信是无消息保护边界的。

    UDP(user datagram protocol,用户数据报协议)是无连接的,面向消息的,提供高效率服务。不会使用块的合并优化算法,, 由于
    UDP支持的是一对多的模式,所以接收端的skbuff(套接字缓冲区)采用了链式结构来记录每一个到达的UDP包,在每个UDP包中就有了消
    息头(消息来源地址,端口等信息),这样,对于接收端来说,就容易进行区分处理了。 即面向消息的通信是有消息保护边界的。

    发送方引起的粘包是由TCP协议本身造成的,TCP为提高传输效率,发送方往往要收集到足够多的数据后才发送一个TCP段。若连续几次
    需要send的数据都很少,通常TCP会根据优化算法把这些数据合成一个TCP段后一次发送出去,这样接收方就收到了粘包数据

    所谓粘包问题主要还是因为接收方不知道消息之间的界限,不知道一次性提取多少字节的数据所造成的
    粘包现象:
     1 import socket,time
     2 
     3 phone=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
     4 #绑定电话卡
     5 ip_port=('127.0.0.1',8080)
     6 phone.bind(ip_port)
     7 phone.listen(5)
     8 conn,addr=phone.accept()
     9 
    10 data1=conn.recv(1024)
    11 print('第一个包',data1)
    12 data2=conn.recv(1024)
    13 print('第二个包',data2)
    14 
    15 
    16 data1=conn.recv(1) #b'h'
    17 print('第一个包',data1)
    18 time.sleep(5)                      #利用time来解决粘包问题
    19 data2=conn.recv(1024) #b'elloworldSB'
    20 print('第二个包',data2)
    View Code
     1 import socket,time
     2 
     3 phone=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
     4 
     5 ip_port=('127.0.0.1',8080)
     6 phone.connect(ip_port)
     7 
     8 
     9 phone.send('helloworld'.encode('utf-8'))
    10 time.sleep(3)              #利用time来解决粘包问题
    11 phone.send('SB'.encode('utf-8'))
    View Code
    利用struct解决粘包问题

    (1)为字节流加上自定义固定长度报头,报头中包含字节流长度,然后一次send到对端,对端在接收时,先从缓存中取出定长的报头,然后再取真实数据

    struct模块 

    该模块可以把一个类型,如数字,转成固定长度的bytes

    >>> struct.pack('i',1111111111111)

    struct.error: 'i' format requires -2147483648 <= number <= 2147483647 #这个是范围

     

    (2)我们可以把报头做成字典,字典里包含将要发送的真实数据的详细信息,然后json序列化,然后用struck将序列化后的数据长度打包成4个字节(4个自己足够用了)

    发送时:

    先发报头长度

    再编码报头内容然后发送

    最后发真实内容

    接收时:

    先手报头长度,用struct取出来

    根据取出的长度收取报头内容,然后解码,反序列化

    从反序列化的结果中取出待取数据的详细信息,然后去取真实的数据内容

     1 from socket import *
     2 import subprocess
     3 import struct
     4 import json
     5 t = socket(AF_INET,SOCK_STREAM)
     6 t.bind(('192.168.184.128',8080))
     7 t.listen(5)
     8 
     9 while True:  #链接循环
    10     conn,addr = t.accept()
    11     while True: # 通信循环
    12         try:
    13             cmd = conn.recv(1024)
    14             if not cmd:break
    15             res = subprocess.Popen(cmd.decode('utf8'),
    16                                    shell = True,
    17                                    stdout = subprocess.PIPE,
    18                                    stderr= subprocess.PIPE)
    19             out_res = res.stdout.read()
    20             err_res = res.stderr.read()
    21             data_size = len(out_res)+len(err_res)
    22             head_dic = {'data_size':data_size}
    23             head_json = json.dumps(head_dic)
    24             head_bytes = head_json.encode('utf8')
    25             #发送报头的长度
    26             head_len = len(head_bytes)
    27             conn.send(struct.pack('i',head_len))  #该模块将一串数字打包以固定长度(4个字节)发送给客户端
    28             #发送报头
    29             conn.send(head_bytes)
    30             #发送数据部分
    31             conn.send(out_res) # linux环境中 多个命令用分号隔开的情况
    32             conn.send(err_res)
    33         except Exception:
    34             break
    35     conn.close()    #通信完成,关闭链接
    36 t.close()
    View Code
     1 from socket import *
     2 import struct
     3 import json
     4 t =socket(AF_INET,SOCK_STREAM)
     5 t.connect(('192.168.184.128',8080))
     6 
     7 while True:  #通信循环
     8     #发消息
     9     cmd = input('>>> :')
    10     if not cmd: continue
    11     t.send(bytes(cmd,encoding='utf8'))
    12     #收报头的长度
    13     head_struct=t.recv(4)
    14     head_len = struct.unpack('i',head_struct)
    15     #收报头
    16     head_bytes = t.recv(head_len)
    17     head_json = head_bytes.decode('utf8')
    18 
    19     head_dic = json.loads(head_json)
    20     print(head_dic)
    21     data_size = head_dic['data_size']
    22 
    23     #收数据
    24     recv_size = 0
    25     recv_data = b''
    26     while recv_size < data_size:
    27 
    28         data = t.recv(1024)
    29         recv_size += len(data)
    30         recv_data += data
    31     print(recv_data.decode('utf8'))         #基于windows的shell 用GBK解码
    32                                         #基于linux的shell 用utf8解码
    33 
    34 t.close()
    View Code

    模拟远程访问ssh

     1 from socket import *
     2 import subprocess
     3 t = socket(AF_INET,SOCK_STREAM) #两个参数   基于网络通信的套接字,基于tcp协议的套接字
     4 t.bind(('127.0.0.1',8080)) #绑定唯一一个IP地址和端口号     此处为本地回环地址
     5 t.listen(5)  #开启监听    同时允许最多5个客户端访问
     6 
     7 while True:  #链接循环
     8     conn,addr = t.accept()  #等待客户端链接
     9     while True: # 通信循环
    10         try:           #应对windows系统   客户端关闭链接的情况下
    11             cmd = conn.recv(1024)  #接收客户端消息    每次接收1024字节的数据
    12             if not cmd:break   #应对linux系统   服务器不断的接收空
    13             res = subprocess.Popen(cmd.decode('utf8'),
    14                                    shell = True,
    15                                    stdout = subprocess.PIPE,
    16                                    stderr= subprocess.PIPE)
    17             conn.send(res.stdout.read()) # linux环境中 多个命令用分号隔开的情况
    18             conn.send(res.stderr.read())
    19 
    20 
    21             err = res.stderr.read()            #只有一个命令的情况下
    22             if err :
    23                 cmd_res = err
    24             else:
    25                 cmd_res = res.stdout.read()
    26             conn.send(cmd_res)
    27         except Exception:
    28             break
    29     conn.close()    #通信完成,关闭链接
    30 t.close()
    View Code
     1 from socket import *
     2 t =socket(AF_INET,SOCK_STREAM)
     3 t.connect(('192.168.184.128',8280))
     4 
     5 while True:  #通信循环
     6     cmd = input('>>> :')
     7     if not cmd: continue
     8     t.send(cmd.encode('utf8'))
     9     data = t.recv(1024)
    10     print(data.decode('utf8'))         #基于windows的shell 用GBK解码
    11                                         #基于linux的shell 用utf8解码
    12 
    13 t.close()
    View Code

    socketserver实现并发

    基于tcp的套接字,关键就是两个循环,一个链接循环,一个通信循环

    socketserver模块中分两大类:server类(解决链接问题)和request类(解决通信问题)

    server类:

    request类:

    继承关系:

    tcp协议下的并发问题

     1 #服务端
     2 import socketserver
     3 
     4 class Ftpserver(socketserver.BaseRequestHandler):  #通信链接
     5     def handle(self):
     6         print('==========>',self)
     7         print(self.request)                 #self.request  ==   conn
     8         while True:
     9             data = self.request.recv(1024)
    10             print(data.decode('utf8'))
    11             data1 =input('>>')
    12             self.request.send(data1.encode('utf8'))
    13 
    14 if __name__ == '__main__':
    15     obj = socketserver.ThreadingTCPServer(('127.0.0.1',8080),Ftpserver)
    16     obj.serve_forever()#链接循环
    View Code

    udp协议下的并发问题

     1 import socketserver
     2 class Ftpserver(socketserver.BaseRequestHandler):
     3     def handle(self):
     4         print(self.request)
     5         print(self.client_address)
     6         # msg = input('>>>:')
     7         self.request[1].sendto(self.request[0],self.client_address)
     8 
     9 if __name__ == '__main__':
    10     obj = socketserver.ThreadingUDPServer(('127.0.0.1',8080),Ftpserver)
    11     obj.serve_forever()
    View Code

    socketserver源码分析:

    SocketServer的ThreadingTCPServer之所以可以同时处理请求得益于 select 和 Threading 两个东西,其实本质上就是在服务器端为每一个客户端创建一个线程,当前线程用来处理对应客户端的请求,所以,可以支持同时n个客户端链接(长连接)

    1 启动服务端程序
    2 执行 TCPServer.__init__ 方法,创建服务端Socket对象并绑定 IP 和 端口
    3 执行 BaseServer.__init__ 方法,将自定义的继承自SocketServer.BaseRequestHandler 的类 MyRequestHandle赋值给 self.RequestHandlerClass
    4 执行 BaseServer.server_forever 方法,While 循环一直监听是否有客户端请求到达 ...
    5 当客户端连接到达服务器
    6 执行 ThreadingMixIn.process_request 方法,创建一个 “线程” 用来处理请求
    7 执行 ThreadingMixIn.process_request_thread 方法
    8 执行 BaseServer.finish_request 方法,执行 self.RequestHandlerClass()  即:执行 自定义 MyRequestHandler 的构造方法(自动调用基类BaseRequestHandler的构造方法,在该构造方法中又会调用 MyRequestHandler的handle方法)

    简单例子实现源码重现:

     1 import socket
     2 import threading
     3 import select
     4 
     5 def process(request,client_address):
     6     print(request,client_address)
     7     conn = request
     8     conn.sendall('欢迎致电10086,请输入。。。。'.encode('utf8'))
     9     flag = True
    10     while flag:
    11         data = conn.recv(1024)
    12         if data == 'exit':
    13             flag = False
    14         elif data == '0':
    15             conn.sendall('可能会被录音'.encode('utf8'))
    16         else:
    17             conn.sendall('重新输'.encode('utf8'))
    18 
    19 sk = socket.socket()
    20 sk.bind(('127.0.0.1',8080))
    21 sk.listen()
    22 
    23 while True:
    24     r,w,e=select.select([sk,],[],[],1)
    25     if sk in r:
    26         print('get request')
    27         request,client_address = sk.accept()
    28         t = threading.Thread(target=process,args=(request,client_address))
    29         t.start()
    30 sk.close()

    应用:

    FTP上传下载

    1. 用户登陆
    2. 上传/下载文件
    3. 不同用户家目录不同
    4. 查看当前目录下文件
    5. 充分使用面向对象知识
    6. 用户加密认证
    7. 多用户同时登陆
    8. 每个用户有自己的家目录且只能访问自己的家目录
    9. 对用户进行磁盘配额、不同用户配额可不同
    10. 用户可以登陆server后,可切换目录
    11. 查看当前目录下文件
    12. 上传下载文件,保证文件一致性
    13. 传输过程中现实进度条
    14. 支持断点续传



  • 相关阅读:
    HDU6301 SET集合的应用 贪心
    线段树与树状数组的对比应用
    树状数组
    JDBC链接MySQL数据库
    HDU4686Arc of Dream 矩阵快速幂
    HDU1757矩阵快速幂
    B1013. 数素数 (20)
    B1023. 组个最小数 (20)
    [教材]B1020. 月饼 (25)
    [教材]A1025. PAT Ranking (25)
  • 原文地址:https://www.cnblogs.com/liuguniang/p/6854353.html
Copyright © 2011-2022 走看看