最近看了下thrift的源码部分,有小小收获。以下是对thrift的server层结合自己的理解做一个小小的总结,理解不正确的地方还请大家指出。
(一)简介
thrift是一个支持多语言之间远程函数调用的开源工具,因为其方便的使用和对c++、java、php等多种主流语言的支持而获得广泛地使用。server层属于其接受客户端请求的服务模型层,用于处理接受客户端过来的请求。
现在支持三种模型:
(1)单线程模型,主线程监听socket、获得连接请求、处理请求
(2)多线程模型,主线程监听socket,获得新连接,使用threadFactory创建新线程处理该连接直到连接断开
(3)线程池模型,主线程处理通信请求将获得的新连接fd生成TConnectedClient加入任务队列;多个工作线程(ThreadManager管理)从任务队列取连接、处理请求,直到连接断开,再从队列取新的连接
(二)结构
如上图所示,
TServerFramework是3个服务模型类的基类,通过serve方法提供了处理所有连接请求的循环逻辑,而TSimpleServer、TThreadedServer和TThreadPoolServer三个类分别对应3中服务模型。
TConnectedClient类存储了连接到服务端的客户端的相关信息,提供了处理一个请求的方法run,此类继承于Runnable。
(三)实现
TServerFramework - 提供统一处理循环
mon_ | 限制并发客户端数量 | Monitor |
clients_ | 并发客户端数量 | int64_t |
hwm_ | 并发最高值 | int64_t |
limit_ | 并发限制值 | int64_t |
serve方法
循环地从TServerTransport接收clients,通过调用newlyConnectedClient方法送去处理。
newlyConnectedClient调用onClientConnected方法处理连接请求,绑定disposeConnectedClient方法处理连接销毁,并控制并发连接数。
每个不同的服务模型类提供不同的onClientConnected来实现不同的服务模型。
TSimpleServer - 单线程服务模型
onClientConnected方法
直接调用TConnectedClient的run方法处理请求
TThreadedServer - 多线程服务模型
serve方法
调用TServerFramework的serve,启动多线程服务模型入口
onClientConnected方法
每到来一个新的连接,都新建一个线程使用TConnectedClient的run进行处理
TThreadPoolServer - 线程池服务模型
threadManager_ | 线程管理 | ThreadManader |
stop_ | voatile bool | |
timeout_ | 等待任务数超限时的超时时间 | volatile int64_t |
taskExpiration_ | 任务过期时间 | volatile int64_t |
serve方法
调用TServerFramework的serve,启动多线程服务模型入口
threadManager->join等待threadManager的线程池中线程结束
onClientConnected方法
通过使用ThreadManager的add将新的连接请求放入任务队列
实际处理要等到ThreadManager的Worker线程的run从任务队列取任务,执行TConnectedClient的run方法。
TConnectedClient - 连接TServer的客户端
processor_ | 处理类 | TProcessor |
inputProtocol_ | 输入协议 | TProtocol |
outputProtocol_ | 输出协议 | TProtocol |
eventHandler_ | TServerEventHandler | |
client_ | 客户端请求 | TTransport |
opaqueContext_ | 从eventHandler_获取的上下文 | void* |
run方法
处理一个连接上的请求,直到连接断开
使用processor的process方法
(四)总结
3种服务模型个有优劣,单线程模型一般只用在调试环境中,同时刻只能处理一个连接;多线程模型同时可以处理多个新连接,但每次处理新的连接都会新建线程,存在不小的开销;线程池模型一开始就创建好线程,减小了创建线程、销毁线程开销,但是多了维护队列、固定数目线程的开销。