socket
socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。
socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”
对于文件用【打开】【读写】【关闭】模式来操作。
socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)
基本的python socket模块
Python 提供了两个基本的 socket 模块。第一个是 Socket
,它提供了标准的 BSD Sockets API。第二个是 SocketServer
,它提供了服务器中心类,可以简化网络服务器的开发。Python 使用一种异步的方式来实现这种功能,您可以提供一些插件类来处理服务器中应用程序特有的任务。
类/模块 | 说明 |
socket | 低层网络接口(每个 BSD API) |
socketserv | 提供简化网络服务器开发的类 |
socket 模块
Socket
模块提供了 UNIX® 程序员所熟悉的基本网络服务(也称为 BSD API)。这个模块中提供了在构建 socket 服务器和客户机时所需要的所有功能。
这个 API 与标准的 C API 之间的区别在于它是面向对象的。在 C 中,socket 描述符是从 socket 调用中获得的,然后会作为一个参数传递给 BSD API 函数。在 Python 中,socket
方法会向应用 socket 方法的对象返回一个 socket 对象。
类方法 和 实例方法 之间的区别在于,实例方法需要有一个 socket 实例(从 socket 返回)才能执行,而类方法则不需要。
socket编程思路:
1、tcp服务端
- 创建套接字,绑定套接字到本地ip与端口
- 开始监听连接
- 进入循环体,不断接收客户端发来的连接请求
- 接收到客户端发来的数据,并给客户端发送一个数据证明服务端已经收到了客户端的请求
- 传输完毕后,关闭套接字
2、tcp客户端
- 创建套接字,连接远程地址
- 连接后发送数据和接收数据
- 数据传输完毕,关闭套接字
创建一个socket连接
1、服务端
2、客户端
socket 聊天机器人
服务端与客户端之间的相互交流
#!usr/bin/env/python # -*- coding:utf-8 -*- import socket # 创建一个socket对象 sk = socket.socket() # 绑定允许连接的IP地址和端口 sk.bind(('127.0.0.1', 8000, )) # 服务端允许起来之后,限制客户端连接的数量,如果超过五个连接,第六个连接来的时候直接断开第六个。 sk.listen(5) while True: # 会一直阻塞,等待接收客户端的请求,如果有客户端连接会获取两个值,conn=创建的连接,address=客户端的IP和端口 conn, address = sk.accept() # 当用户连接过来的时候就给用户发送一条信息,在Python3里面需要把发送的内容转换为字节 conn.sendall(bytes("你好,欢迎登陆!", encoding="utf-8")) while True: # 输出等待客户端发送内容 print("正在等待Client输入内容......") # 接收客户端发送过来的内容 ret_bytes = conn.recv(1024) # 转换成字符串类型 ret_str = str(ret_bytes, encoding="utf-8") # 输出用户发送过来的内容 print(ret_str) # 如果用户输入的是q if ret_str == "q": # 则退出循环,等待下个用户输入 break # 给客户端发送内容 inp = input("Service请输入要发送的内容>>> ") conn.sendall(bytes(inp, encoding="utf-8"))
#!usr/bin/env/python # -*- coding:utf-8 -*- import socket # 创建一个socket对象 obj = socket.socket() # 制定服务端的IP地址和端口 obj.connect(('127.0.0.1', 8000, )) # 阻塞,等待服务端发送内容,接受服务端发送过来的内容,最大接受1024字节 ret_bytes = obj.recv(1024) # 因为服务端发送过来的是字节,所以我们需要把字节转换为字符串进行输出 ret_str = str(ret_bytes, encoding="utf-8") # 输出内容 print(ret_str) while True: # 当进入连接的时候,提示让用户输入内容 inp = input("Client请输入要发送的内容>>> ") # 如果输出q则退出 if inp == "q": # 把q发送给服务端 obj.sendall(bytes(inp, encoding="utf-8")) # 退出当前while break else: # 否则就把用户输入的内容发送给用户 obj.sendall(bytes(inp, encoding="utf-8")) # 等待服务端回答 print("正在等待Server输入内容......") # 获取服务端发送过来的结果 ret = str(obj.recv(1024), encoding="utf-8") # 输出结果 print(ret) # 连接完成之后关闭链接 obj.close()
有进度条的文件传输
import socket # 创建一个socket对象 sk = socket.socket() # 允许连接的IP和端口 sk.bind(('127.0.0.1', 8000)) # 最大连接数 sk.listen(5) while True: # 会一直阻塞,等待接收客户端的请求,如果有客户端连接会获取两个值,conn=创建的连接,address=客户端的IP和端口 conn, address = sk.accept() # 客户端发送过来的文件大小 file_size = str(conn.recv(1024),encoding="utf-8") # 给客户端发送已经收到文件大小 conn.sendall(bytes("ack", encoding="utf-8")) # 文件大小转换成int类型 total_size = int(file_size) # 创建一个默认的值 has_recv = 0 # 打开一个新文件,以wb模式打开 f = open('new_my.jpg', 'wb') # 进入循环 while True: # 如果传送过来的大小等于文件总大小,那么就退出 if total_size == has_recv: break # 接受客户端发送过来的内容 data = conn.recv(1024) # 写入到文件当中 f.write(data) # 现在的大小加上客户端发送过来的大小 has_recv += len(data) # 关闭 f.close()
#!usr/bin/env/python # -*- coding:utf-8 -*- import socket import os import time import sys # 创建一个socket对象 obj = socket.socket() # 服务端的IP和端口 obj.connect(('127.0.0.1', 8000)) # 用os模块获取要传送的文件总大小 size = os.stat("my.jpg").st_size # 把文件总大小发送给服务端 obj.sendall(bytes(str(size), encoding="utf-8")) # 接受服务端返回的信息 obj.recv(1024) #文件传输之前has_size = 0 has_size = 0 # 以rb的模式打开一个要发送的文件d with open("my.jpg", "rb") as f: for line in f:# 循环文件的所有内容 has_size += len(line)#has_size的值等于文件中每一行的值加起来 time.sleep(0.01)#由于文件较小,要看到进度条的效果加一个执行的时间间隔 sys.stdout.write(" ")#每一次都清空上次的写入内容 sys.stdout.write("%s%% | %s"%(int(has_size/size*100), int(has_size/size*50)*"▓")) sys.stdout.flush()#强制刷新缓冲区 # 发送给服务端 obj.sendall(line)#将文件的内容一行行的发送到服务端 sys.stdout.write("传输完成 ") # 关闭退出 obj.close()
结果展示
多用户登录
利用socketserver实现多并发吗,socketserver内部会调用socket模块进行功能上的实现
import socketserver class MyServer(socketserver.BaseRequestHandler): def handle(self): conn = self.request#建立连接 conn.sendall(bytes("你好,欢迎登陆!", encoding="utf-8"))#只要连接一建立服务端直接给客户端一个回应 while True: # 输出等待客户端发送内容 print("正在等待Client输入内容......") # 接收客户端发送过来的内容 ret_bytes = conn.recv(1024) # 转换成字符串类型 ret_str = str(ret_bytes, encoding="utf-8") # 输出用户发送过来的内容 print(ret_str) # 如果用户输入的是q if ret_str == "q": # 则退出循环,等待下个用户输入 break # 给客户端发送内容 inp = input("Service请输入要发送的内容>>> ") conn.sendall(bytes(inp, encoding="utf-8")) if __name__ == "__main__": server = socketserver.ThreadingTCPServer(('127.0.0.1', 999, ), MyServer) server.serve_forever()
import socket # 创建一个socket对象 obj = socket.socket() # 制定服务端的IP地址和端口 obj.connect(('127.0.0.1', 999, )) # 阻塞,等待服务端发送内容,接受服务端发送过来的内容,最大接受1024字节 ret_bytes = obj.recv(1024) # 因为服务端发送过来的是字节,所以我们需要把字节转换为字符串进行输出 ret_str = str(ret_bytes, encoding="utf-8") # 输出内容 print(ret_str) while True: # 当进入连接的时候,提示让用户输入内容 inp = input("Client请输入要发送的内容>>> ") # 如果输出q则退出 if inp == "q": # 把q发送给服务端 obj.sendall(bytes(inp, encoding="utf-8")) # 退出当前while break else: # 否则就把用户输入的内容发送给用户 obj.sendall(bytes(inp, encoding="utf-8")) # 等待服务端回答 print("正在等待Server输入内容......") # 获取服务端发送过来的结果 ret = str(obj.recv(1024), encoding="utf-8") # 输出结果 print(ret) # 连接完成之后关闭链接 obj.close()
文件上传以及断点续传的功能:
import socket server_socket = socket.socket() server_socket.bind(('127.0.0.1', 8000,)) server_socket.listen(4) conn, address = server_socket.accept() toatl_size =int(str(conn.recv(1024), encoding='utf-8')) conn.sendall(bytes(str(toatl_size), encoding='utf-8')) # 解决粘包的问题 have_recv = 0 f = open('22.txt', 'wb') while True: if have_recv == toatl_size: break else: ret = conn.recv(1024) f.write(ret) have_recv += len(ret) f.close()
import socket import os client_socket = socket.socket() client_socket.connect(('127.0.0.1', 8000,)) file_size = os.stat('1.txt').st_size # 由客户端传文件的时候,客户端告诉服务端文件大小 client_socket.sendall(bytes(str(file_size), encoding='utf-8')) # 发的时候先保存在缓冲区,可能会出现粘包 data = client_socket.recv(1024) # 接受下服务端发来的数据,确认收到了发过去的文件大小 have_rcv = 0 if int(str(data, encoding='utf-8')) == file_size: with open('1.txt', 'rb') as f: for line in f: client_socket.sendall(line) have_rcv += len(line) print('中场休息,等下再传') break # 传送一行后中断,模拟断点 with open('1.txt', 'rb') as f: # 模拟断点续传 f.seek(have_rcv) # 文件指针指到已经上传完成的部分 for line in f: client_socket.sendall(line) client_socket.close()
I/O多路复用
I/O多路复用:通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作。
Linux
Linux中的 select,poll,epoll 都是IO多路复用的机制。
select select最早于1983年出现在4.2BSD中,它通过一个select()系统调用来监视多个文件描述符的数组,当select()返回后,该数组中就绪的文件描述符便会被内核修改标志位,使得进程可以获得这些文件描述符从而进行后续的读写操作。 select目前几乎在所有的平台上支持,其良好跨平台支持也是它的一个优点,事实上从现在看来,这也是它所剩不多的优点之一。 select的一个缺点在于单个进程能够监视的文件描述符的数量存在最大限制,在Linux上一般为1024,不过可以通过修改宏定义甚至重新编译内核的方式提升这一限制。 另外,select()所维护的存储大量文件描述符的数据结构,随着文件描述符数量的增大,其复制的开销也线性增长。同时,由于网络响应时间的延迟使得大量TCP连接处于非活跃状态,但调用select()会对所有socket进行一次线性扫描,所以这也浪费了一定的开销。 poll poll在1986年诞生于System V Release 3,它和select在本质上没有多大差别,但是poll没有最大文件描述符数量的限制。 poll和select同样存在一个缺点就是,包含大量文件描述符的数组被整体复制于用户态和内核的地址空间之间,而不论这些文件描述符是否就绪,它的开销随着文件描述符数量的增加而线性增大。 另外,select()和poll()将就绪的文件描述符告诉进程后,如果进程没有对其进行IO操作,那么下次调用select()和poll()的时候将再次报告这些文件描述符,所以它们一般不会丢失就绪的消息,这种方式称为水平触发(Level Triggered)。 epoll 直到Linux2.6才出现了由内核直接支持的实现方法,那就是epoll,它几乎具备了之前所说的一切优点,被公认为Linux2.6下性能最好的多路I/O就绪通知方法。 epoll可以同时支持水平触发和边缘触发(Edge Triggered,只告诉进程哪些文件描述符刚刚变为就绪状态,它只说一遍,如果我们没有采取行动,那么它将不会再次告知,这种方式称为边缘触发),理论上边缘触发的性能要更高一些,但是代码实现相当复杂。 epoll同样只告知那些就绪的文件描述符,而且当我们调用epoll_wait()获得就绪文件描述符时,返回的不是实际的描述符,而是一个代表就绪描述符数量的值,你只需要去epoll指定的一个数组中依次取得相应数量的文件描述符即可,这里也使用了内存映射(mmap)技术,这样便彻底省掉了这些文件描述符在系统调用时复制的开销。 另一个本质的改进在于epoll采用基于事件的就绪通知方式。在select/poll中,进程只有在调用一定的方法后,内核才对所有监视的文件描述符进行扫描,而epoll事先通过epoll_ctl()来注册一个文件描述符,一旦基于某个文件描述符就绪时,内核会采用类似callback的回调机制,迅速激活这个文件描述符,当进程调用epoll_wait()时便得到通知。
Python
Python中有一个select模块,其中提供了:select、poll、epoll三个方法,分别调用系统的 select,poll,epoll 从而实现IO多路复用。
Windows Python: 提供: select Mac Python: 提供: select Linux Python: 提供: select、poll、epoll
对于select方法:
句柄列表11, 句柄列表22, 句柄列表33 = select.select(句柄序列1, 句柄序列2, 句柄序列3, 超时时间) 参数: 可接受四个参数(前三个必须) 返回值:三个列表 select方法用来监视文件句柄,如果句柄发生变化,则获取该句柄。 1、当 参数1 序列中的句柄发生可读时(accetp和read),则获取发生变化的句柄并添加到 返回值1 序列中 2、当 参数2 序列中含有句柄时,则将该序列中所有的句柄添加到 返回值2 序列中 3、当 参数3 序列中的句柄发生错误时,则将该发生错误的句柄添加到 返回值3 序列中 4、当 超时时间 未设置,则select会一直阻塞,直到监听的句柄发生变化 当 超时时间 = 1时,那么如果监听的句柄均无任何变化,则select会阻塞 1 秒,之后返回三个空列表,如果监听的句柄有变化,则直接执行。
#!/usr/bin/env python # -*- coding:utf-8 -*- import select import threading import sys while True: readable, writeable, error = select.select([sys.stdin,],[],[],1) if sys.stdin in readable: print 'select get stdin',sys.stdin.readline()
#!/usr/bin/env python # -*- coding:utf-8 -*- import socket import select sk1 = socket.socket(socket.AF_INET, socket.SOCK_STREAM) sk1.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) sk1.bind(('127.0.0.1',8002)) sk1.listen(5) sk1.setblocking(0) inputs = [sk1,] while True: readable_list, writeable_list, error_list = select.select(inputs, [], inputs, 1) for r in readable_list: # 当客户端第一次连接服务端时 if sk1 == r: print 'accept' request, address = r.accept() request.setblocking(0) inputs.append(request) # 当客户端连接上服务端之后,再次发送数据时 else: received = r.recv(1024) # 当正常接收客户端发送的数据时 if received: print 'received data:', received # 当客户端关闭程序时 else: inputs.remove(r) sk1.close()
#!/usr/bin/env python # -*- coding:utf-8 -*- import socket ip_port = ('127.0.0.1',8002) sk = socket.socket() sk.connect(ip_port) while True: inp = raw_input('please input:') sk.sendall(inp) sk.close()
此处的Socket服务端相比与原生的Socket,他支持当某一个请求不再发送数据时,服务器端不会等待而是可以去处理其他请求的数据。但是,如果每个请求的耗时比较长时,select版本的服务器端也无法完成同时操作。
#!/usr/bin/env python #coding:utf8 ''' 服务器的实现 采用select的方式 ''' import select import socket import sys import Queue #创建套接字并设置该套接字为非阻塞模式 server = socket.socket(socket.AF_INET,socket.SOCK_STREAM) server.setblocking(0) #绑定套接字 server_address = ('localhost',10000) print >>sys.stderr,'starting up on %s port %s'% server_address server.bind(server_address) #将该socket变成服务模式 #backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5 #这个值不能无限大,因为要在内核中维护连接队列 server.listen(5) #初始化读取数据的监听列表,最开始时希望从server这个套接字上读取数据 inputs = [server] #初始化写入数据的监听列表,最开始并没有客户端连接进来,所以列表为空 outputs = [] #要发往客户端的数据 message_queues = {} while inputs: print >>sys.stderr,'waiting for the next event' #调用select监听所有监听列表中的套接字,并将准备好的套接字加入到对应的列表中 readable,writable,exceptional = select.select(inputs,outputs,inputs)#列表中的socket 套接字 如果是文件呢? #监控文件句柄有某一处发生了变化 可写 可读 异常属于Linux中的网络编程 #属于同步I/O操作,属于I/O复用模型的一种 #rlist--等待到准备好读 #wlist--等待到准备好写 #xlist--等待到一种异常 #处理可读取的套接字 ''' 如果server这个套接字可读,则说明有新链接到来 此时在server套接字上调用accept,生成一个与客户端通讯的套接字 并将与客户端通讯的套接字加入inputs列表,下一次可以通过select检查连接是否可读 然后在发往客户端的缓冲中加入一项,键名为:与客户端通讯的套接字,键值为空队列 select系统调用是用来让我们的程序监视多个文件句柄(file descrīptor)的状态变化的。程序会停在select这里等待, 直到被监视的文件句柄有某一个或多个发生了状态改变 ''' ''' 若可读的套接字不是server套接字,有两种情况:一种是有数据到来,另一种是链接断开 如果有数据到来,先接收数据,然后将收到的数据填入往客户端的缓存区中的对应位置,最后 将于客户端通讯的套接字加入到写数据的监听列表: 如果套接字可读.但没有接收到数据,则说明客户端已经断开。这时需要关闭与客户端连接的套接字 进行资源清理 ''' for s in readable: if s is server: connection,client_address = s.accept() print >>sys.stderr,'connection from',client_address connection.setblocking(0)#设置非阻塞 inputs.append(connection) message_queues[connection] = Queue.Queue() else: data = s.recv(1024) if data: print >>sys.stderr,'received "%s" from %s'% (data,s.getpeername()) message_queues[s].put(data) if s not in outputs: outputs.append(s) else: print >>sys.stderr,'closing',client_address if s in outputs: outputs.remove(s) inputs.remove(s) s.close() del message_queues[s] #处理可写的套接字 ''' 在发送缓冲区中取出响应的数据,发往客户端。 如果没有数据需要写,则将套接字从发送队列中移除,select中不再监视 ''' for s in writable: try: next_msg = message_queues[s].get_nowait() except Queue.Empty: print >>sys.stderr,' ',s,getpeername(),'queue empty' outputs.remove(s) else: print >>sys.stderr,'sending "%s" to %s'% (next_msg,s.getpeername()) s.send(next_msg) #处理异常情况 for s in exceptional: for s in exceptional: print >>sys.stderr,'exception condition on',s.getpeername() inputs.remove(s) if s in outputs: outputs.remove(s) s.close() del message_queues[s]
python 实现多个端口监听,并实现读写分离:
import select import socket sk = socket.socket() sk.bind(('127.0.0.1', 8000,)) sk.listen(5) inputs = [sk] outputs = [] message_dict = {} # 存储每个客户端接受到的信息 while True: r_list, w_list, e_list = select.select(inputs, outputs, [], 1) print(len(inputs)) for sk_or_conn in r_list: if sk_or_conn == sk: # 一旦有客户端连接,sk发生变化 conn, addr = sk.accept() inputs.append(conn) # 将客户端的conn添加到监听列表 message_dict[conn] = [] # 以客户端的conn为key,生成一个新列表来存储接受到的信息 # conn.sendall(bytes('hello', encoding='utf-8')) else: try: ret = sk_or_conn.recv(1024) # 监听的列表里面如果有客户端发送信息, except Exception as ex: inputs.remove(sk_or_conn) # 如果客户端断开的话,从监听的列表里面移除 else: data = str(ret, encoding='utf-8') message_dict[sk_or_conn].append(data) # 将监听的信息放到字典里 outputs.append(sk_or_conn) # 放到outputs里面 # sk_or_conn.sendall(bytes(data+'hello', encoding='utf-8')) for conn in w_list: # 单独实现写的操作 message = message_dict[conn][0] conn.sendall(bytes(message+'hello', encoding='utf-8')) del message_dict[conn][0] outputs.remove(conn)
import socket client_socket = socket.socket() client_socket.connect(('127.0.0.1', 8000,)) while True: inp = input('>>>') client_socket.sendall(bytes(inp, encoding='utf-8')) data = str(client_socket.recv(1024), encoding='utf-8') print(data) client_socket.close() #client.py2 import socket client_socket = socket.socket() client_socket.connect(('127.0.0.1', 8000,)) while True: inp = input('>>>') client_socket.sendall(bytes(inp, encoding='utf-8')) data = str(client_socket.recv(1024), encoding='utf-8') print(data) client_socket.close()
SocketServer模块
SocketServer内部使用 IO多路复用 以及 “多线程” 和 “多进程” ,从而实现并发处理多个客户端请求的Socket服务端。即:每个客户端请求连接到服务器时,Socket服务端都会在服务器是创建一个“线程”或者“进程” 专门负责处理当前客户端的所有请求。
ThreadingTCPServer
ThreadingTCPServer实现的Soket服务器内部会为每个client创建一个 “线程”,该线程用来和客户端进行交互。
1、ThreadingTCPServer基础
使用ThreadingTCPServer:
- 创建一个继承自 SocketServer.BaseRequestHandler 的类
- 类中必须定义一个名称为 handle 的方法
- 启动ThreadingTCPServer
#!/usr/bin/env python # -*- coding:utf-8 -*- import SocketServer class MyServer(SocketServer.BaseRequestHandler): def handle(self): # print self.request,self.client_address,self.server conn = self.request conn.sendall('欢迎致电 10086,请输入1xxx,0转人工服务.') Flag = True while Flag: data = conn.recv(1024) if data == 'exit': Flag = False elif data == '0': conn.sendall('通过可能会被录音.balabala一大推') else: conn.sendall('请重新输入.') if __name__ == '__main__': server = SocketServer.ThreadingTCPServer(('127.0.0.1',8009),MyServer) server.serve_forever()
#!/usr/bin/env python # -*- coding:utf-8 -*- import socket ip_port = ('127.0.0.1',8009) sk = socket.socket() sk.connect(ip_port) sk.settimeout(5) while True: data = sk.recv(1024) print 'receive:',data inp = raw_input('please input:') sk.sendall(inp) if inp == 'exit': break sk.close()
2、ThreadingTCPServer源码剖析
ThreadingTCPServer的类图关系如下:
内部调用流程为:
- 启动服务端程序
- 执行 TCPServer.__init__ 方法,创建服务端Socket对象并绑定 IP 和 端口
- 执行 BaseServer.__init__ 方法,将自定义的继承自SocketServer.BaseRequestHandler 的类 MyRequestHandle赋值给 self.RequestHandlerClass
- 执行 BaseServer.server_forever 方法,While 循环一直监听是否有客户端请求到达 ...
- 当客户端连接到达服务器
- 执行 ThreadingMixIn.process_request 方法,创建一个 “线程” 用来处理请求
- 执行 ThreadingMixIn.process_request_thread 方法
- 执行 BaseServer.finish_request 方法,执行 self.RequestHandlerClass() 即:执行 自定义 MyRequestHandler 的构造方法(自动调用基类BaseRequestHandler的构造方法,在该构造方法中又会调用 MyRequestHandler的handle方法)
ThreadingTCPServer相关源码
class BaseServer: """Base class for server classes. Methods for the caller: - __init__(server_address, RequestHandlerClass) - serve_forever(poll_interval=0.5) - shutdown() - handle_request() # if you do not use serve_forever() - fileno() -> int # for select() Methods that may be overridden: - server_bind() - server_activate() - get_request() -> request, client_address - handle_timeout() - verify_request(request, client_address) - server_close() - process_request(request, client_address) - shutdown_request(request) - close_request(request) - handle_error() Methods for derived classes: - finish_request(request, client_address) Class variables that may be overridden by derived classes or instances: - timeout - address_family - socket_type - allow_reuse_address Instance variables: - RequestHandlerClass - socket """ timeout = None def __init__(self, server_address, RequestHandlerClass): """Constructor. May be extended, do not override.""" self.server_address = server_address self.RequestHandlerClass = RequestHandlerClass self.__is_shut_down = threading.Event() self.__shutdown_request = False def server_activate(self): """Called by constructor to activate the server. May be overridden. """ pass def serve_forever(self, poll_interval=0.5): """Handle one request at a time until shutdown. Polls for shutdown every poll_interval seconds. Ignores self.timeout. If you need to do periodic tasks, do them in another thread. """ self.__is_shut_down.clear() try: while not self.__shutdown_request: # XXX: Consider using another file descriptor or # connecting to the socket to wake this up instead of # polling. Polling reduces our responsiveness to a # shutdown request and wastes cpu at all other times. r, w, e = _eintr_retry(select.select, [self], [], [], poll_interval) if self in r: self._handle_request_noblock() finally: self.__shutdown_request = False self.__is_shut_down.set() def shutdown(self): """Stops the serve_forever loop. Blocks until the loop has finished. This must be called while serve_forever() is running in another thread, or it will deadlock. """ self.__shutdown_request = True self.__is_shut_down.wait() # The distinction between handling, getting, processing and # finishing a request is fairly arbitrary. Remember: # # - handle_request() is the top-level call. It calls # select, get_request(), verify_request() and process_request() # - get_request() is different for stream or datagram sockets # - process_request() is the place that may fork a new process # or create a new thread to finish the request # - finish_request() instantiates the request handler class; # this constructor will handle the request all by itself def handle_request(self): """Handle one request, possibly blocking. Respects self.timeout. """ # Support people who used socket.settimeout() to escape # handle_request before self.timeout was available. timeout = self.socket.gettimeout() if timeout is None: timeout = self.timeout elif self.timeout is not None: timeout = min(timeout, self.timeout) fd_sets = _eintr_retry(select.select, [self], [], [], timeout) if not fd_sets[0]: self.handle_timeout() return self._handle_request_noblock() def _handle_request_noblock(self): """Handle one request, without blocking. I assume that select.select has returned that the socket is readable before this function was called, so there should be no risk of blocking in get_request(). """ try: request, client_address = self.get_request() except socket.error: return if self.verify_request(request, client_address): try: self.process_request(request, client_address) except: self.handle_error(request, client_address) self.shutdown_request(request) def handle_timeout(self): """Called if no new request arrives within self.timeout. Overridden by ForkingMixIn. """ pass def verify_request(self, request, client_address): """Verify the request. May be overridden. Return True if we should proceed with this request. """ return True def process_request(self, request, client_address): """Call finish_request. Overridden by ForkingMixIn and ThreadingMixIn. """ self.finish_request(request, client_address) self.shutdown_request(request) def server_close(self): """Called to clean-up the server. May be overridden. """ pass def finish_request(self, request, client_address): """Finish one request by instantiating RequestHandlerClass.""" self.RequestHandlerClass(request, client_address, self) def shutdown_request(self, request): """Called to shutdown and close an individual request.""" self.close_request(request) def close_request(self, request): """Called to clean up an individual request.""" pass def handle_error(self, request, client_address): """Handle an error gracefully. May be overridden. The default is to print a traceback and continue. """ print '-'*40 print 'Exception happened during processing of request from', print client_address import traceback traceback.print_exc() # XXX But this goes to stderr! print '-'*40
class TCPServer(BaseServer): """Base class for various socket-based server classes. Defaults to synchronous IP stream (i.e., TCP). Methods for the caller: - __init__(server_address, RequestHandlerClass, bind_and_activate=True) - serve_forever(poll_interval=0.5) - shutdown() - handle_request() # if you don't use serve_forever() - fileno() -> int # for select() Methods that may be overridden: - server_bind() - server_activate() - get_request() -> request, client_address - handle_timeout() - verify_request(request, client_address) - process_request(request, client_address) - shutdown_request(request) - close_request(request) - handle_error() Methods for derived classes: - finish_request(request, client_address) Class variables that may be overridden by derived classes or instances: - timeout - address_family - socket_type - request_queue_size (only for stream sockets) - allow_reuse_address Instance variables: - server_address - RequestHandlerClass - socket """ address_family = socket.AF_INET socket_type = socket.SOCK_STREAM request_queue_size = 5 allow_reuse_address = False def __init__(self, server_address, RequestHandlerClass, bind_and_activate=True): """Constructor. May be extended, do not override.""" BaseServer.__init__(self, server_address, RequestHandlerClass) self.socket = socket.socket(self.address_family, self.socket_type) if bind_and_activate: try: self.server_bind() self.server_activate() except: self.server_close() raise def server_bind(self): """Called by constructor to bind the socket. May be overridden. """ if self.allow_reuse_address: self.socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) self.socket.bind(self.server_address) self.server_address = self.socket.getsockname() def server_activate(self): """Called by constructor to activate the server. May be overridden. """ self.socket.listen(self.request_queue_size) def server_close(self): """Called to clean-up the server. May be overridden. """ self.socket.close() def fileno(self): """Return socket file number. Interface required by select(). """ return self.socket.fileno() def get_request(self): """Get the request and client address from the socket. May be overridden. """ return self.socket.accept() def shutdown_request(self, request): """Called to shutdown and close an individual request.""" try: #explicitly shutdown. socket.close() merely releases #the socket and waits for GC to perform the actual close. request.shutdown(socket.SHUT_WR) except socket.error: pass #some platforms may raise ENOTCONN here self.close_request(request) def close_request(self, request): """Called to clean up an individual request.""" request.close()
class ThreadingMixIn: """Mix-in class to handle each request in a new thread.""" # Decides how threads will act upon termination of the # main process daemon_threads = False def process_request_thread(self, request, client_address): """Same as in BaseServer but as a thread. In addition, exception handling is done here. """ try: self.finish_request(request, client_address) self.shutdown_request(request) except: self.handle_error(request, client_address) self.shutdown_request(request) def process_request(self, request, client_address): """Start a new thread to process the request.""" t = threading.Thread(target = self.process_request_thread, args = (request, client_address)) t.daemon = self.daemon_threads t.start()
class ThreadingTCPServer(ThreadingMixIn, TCPServer): pass
RequestHandler相关源码
实例:
#!/usr/bin/env python # -*- coding:utf-8 -*- import SocketServer class MyServer(SocketServer.BaseRequestHandler): def handle(self): # print self.request,self.client_address,self.server conn = self.request conn.sendall('欢迎致电 10086,请输入1xxx,0转人工服务.') Flag = True while Flag: data = conn.recv(1024) if data == 'exit': Flag = False elif data == '0': conn.sendall('通过可能会被录音.balabala一大推') else: conn.sendall('请重新输入.') if __name__ == '__main__': server = SocketServer.ThreadingTCPServer(('127.0.0.1',8009),MyServer) server.serve_forever()
#!/usr/bin/env python # -*- coding:utf-8 -*- import socket ip_port = ('127.0.0.1',8009) sk = socket.socket() sk.connect(ip_port) sk.settimeout(5) while True: data = sk.recv(1024) print 'receive:',data inp = raw_input('please input:') sk.sendall(inp) if inp == 'exit': break sk.close()
ForkingTCPServer
ForkingTCPServer和ThreadingTCPServer的使用和执行流程基本一致,只不过在内部分别为请求者建立 “线程” 和 “进程”。
基本使用:
#!/usr/bin/env python # -*- coding:utf-8 -*- import SocketServer class MyServer(SocketServer.BaseRequestHandler): def handle(self): # print self.request,self.client_address,self.server conn = self.request conn.sendall('欢迎致电 10086,请输入1xxx,0转人工服务.') Flag = True while Flag: data = conn.recv(1024) if data == 'exit': Flag = False elif data == '0': conn.sendall('通过可能会被录音.balabala一大推') else: conn.sendall('请重新输入.') if __name__ == '__main__': server = SocketServer.ForkingTCPServer(('127.0.0.1',8009),MyServer) server.serve_forever()
#!/usr/bin/env python # -*- coding:utf-8 -*- import socket ip_port = ('127.0.0.1',8009) sk = socket.socket() sk.connect(ip_port) sk.settimeout(5) while True: data = sk.recv(1024) print 'receive:',data inp = raw_input('please input:') sk.sendall(inp) if inp == 'exit': break sk.close()
以上ForkingTCPServer只是将 ThreadingTCPServer 实例中的代码:
server = SocketServer.ThreadingTCPServer(('127.0.0.1',8009),MyRequestHandler) 变更为: server = SocketServer.ForkingTCPServer(('127.0.0.1',8009),MyRequestHandler)
SocketServer的ThreadingTCPServer之所以可以同时处理请求得益于 select 和 os.fork 两个东西,其实本质上就是在服务器端为每一个客户端创建一个进程,当前新创建的进程用来处理对应客户端的请求,所以,可以支持同时n个客户端链接(长连接)。
源码剖析参考 ThreadingTCPServer
Twisted
Twisted是一个事件驱动的网络框架,其中包含了诸多功能,例如:网络协议、线程、数据库管理、网络操作、电子邮件等。
事件驱动
简而言之,事件驱动分为二个部分:第一,注册事件;第二,触发事件。
自定义事件驱动框架,命名为:“弑君者”:
#!/usr/bin/env python # -*- coding:utf-8 -*- # event_drive.py event_list = [] def run(): for event in event_list: obj = event() obj.execute() class BaseHandler(object): """ 用户必须继承该类,从而规范所有类的方法(类似于接口的功能) """ def execute(self): raise Exception('you must overwrite execute')
程序员使用“弑君者框架”:
#!/usr/bin/env python # -*- coding:utf-8 -*- from source import event_drive class MyHandler(event_drive.BaseHandler): def execute(self): print 'event-drive execute MyHandler' event_drive.event_list.append(MyHandler) event_drive.run()
如上述代码,事件驱动只不过是框架规定了执行顺序,程序员在使用框架时,可以向原执行顺序中注册“事件”,从而在框架执行时可以出发已注册的“事件”。
基于事件驱动Socket
#!/usr/bin/env python # -*- coding:utf-8 -*- from twisted.internet import protocol from twisted.internet import reactor class Echo(protocol.Protocol): def dataReceived(self, data): self.transport.write(data) def main(): factory = protocol.ServerFactory() factory.protocol = Echo reactor.listenTCP(8000,factory) reactor.run() if __name__ == '__main__': main()
程序执行流程:
- 运行服务端程序
- 创建Protocol的派生类Echo
- 创建ServerFactory对象,并将Echo类封装到其protocol字段中
- 执行reactor的 listenTCP 方法,内部使用 tcp.Port 创建socket server对象,并将该对象添加到了 reactor的set类型的字段 _read 中
- 执行reactor的 run 方法,内部执行 while 循环,并通过 select 来监视 _read 中文件描述符是否有变化,循环中...
- 客户端请求到达
- 执行reactor的 _doReadOrWrite 方法,其内部通过反射调用 tcp.Port 类的 doRead 方法,内部 accept 客户端连接并创建Server对象实例(用于封装客户端socket信息)和 创建 Echo 对象实例(用于处理请求) ,然后调用 Echo 对象实例的 makeConnection 方法,创建连接。
- 执行 tcp.Server 类的 doRead 方法,读取数据,
- 执行 tcp.Server 类的 _dataReceived 方法,如果读取数据内容为空(关闭链接),否则,出发 Echo 的 dataReceived 方法
- 执行 Echo 的 dataReceived 方法
从源码可以看出,上述实例本质上使用了事件驱动的方法 和 IO多路复用的机制来进行Socket的处理。
#!/usr/bin/env python # -*- coding:utf-8 -*- from twisted.internet import reactor, protocol from twisted.web.client import getPage from twisted.internet import reactor import time class Echo(protocol.Protocol): def dataReceived(self, data): deferred1 = getPage('http://cnblogs.com') deferred1.addCallback(self.printContents) deferred2 = getPage('http://baidu.com') deferred2.addCallback(self.printContents) for i in range(2): time.sleep(1) print 'execute ',i def execute(self,data): self.transport.write(data) def printContents(self,content): print len(content),content[0:100],time.time() def main(): factory = protocol.ServerFactory() factory.protocol = Echo reactor.listenTCP(8000,factory) reactor.run() if __name__ == '__main__': main()