zoukankan      html  css  js  c++  java
  • Netty

    Netty

    目录

    · Linux网络IO模型

        · 文件描述符

        · 阻塞IO模型

        · 非阻塞IO模型

        · IO复用模型

        · 信号驱动IO模型

        · 异步IO模型

    · BIO编程

    · 伪异步IO编程

    · NIO编程

        · Buffer和Channel

        · 深入Buffer

        · Selector

    · AIO编程

    · 四种IO编程对比及选择Netty的原因

    · Netty入门

        · 开发与部署

        · Hello World

    · 粘包/拆包问题

        · 问题及其解决

        · LineBasedFrameDecoder

        · DelimiterBasedFrameDecoder

        · FixedLengthFrameDecoder

    · Java序列化问题

        · 问题描述及其解决

    · HTTP协议开发

        · Netty HTTP

        · 文件服务器

    · WebSocket协议开发

        · 问题及其解决

        · 原理(过程)

        · 开发

    · Netty架构

        · 逻辑架构

        · 高性能

        · 可靠性

        · 可定制性

        · 可扩展性

    · 私有协议栈开发


    Linux网络IO模型

    文件描述符

    1. Linux内核将所有外部设备视为文件来操作。

    2. 对一个文件的读写操作会调用内核提供的系统命令,返回一个file descripter(fd,文件描述符)。

    3. 对一个socket的读写也会有相应的描述符,称为socketfd(socket描述符)。

    阻塞IO模型

    1. 最常用的IO模型。

    2. 默认的IO模型。

    3. 以socket接口为例说明阻塞IO模型。

    非阻塞IO模型

    1. 一般轮训检查内核数据是否就绪。

    2. 如果内核数据未就绪,则直接返回一个EWOULDBLOCK错误。

    IO复用模型

    1. Linux提供select/poll,进程传递一个或多个fd给select或poll系统调用,阻塞在select操作上,这样select/poll可以帮助进程同时检测多个fd是否就绪。

    2. select/poll存在支持fd数量有限、线性轮训等问题,应采用基于事件驱动方式的epoll代替(当有fd就绪时,立即回调函数)。

    信号驱动IO模型

    进程先系统调用sigaction执行一个非阻塞的信号处理函数,进程继续运行。当数据就绪时,为该进程生成一个SIGIO信号,通知进程调用recvfrom读取数据。

    异步IO模型

    1. 进程告知内核启动某个操作,并在内核完成整个操作后再通知进程。

    2. 与信号驱动IO模型区别:信号驱动IO模型只通知数据就绪;异步IO模型通知操作已完成。

    BIO编程

    1. 有一个独立的Acceptor线程负责监听客户端连接,接收到连接后为每个客户端创建一个新的线程进行链路处理,处理完之后,通过输出流返回给客户端,线程销毁。

    2. 问题:服务端线程个数与客户端并发访问数1:1关系。当客户端并发访问量越来越大时,系统会发生线程堆栈溢出、创建新线程失败等问题,最终导致进程宕机或僵死。

    伪异步IO编程

    1. 当新客户端接入时,将客户端Socket封装成一个Task(实现Runnable接口)投递到线程池中进行处理。

    2. 好处:由于可以设置线程池队列的大小和最大线程数,所以资源占用是可控的,客户端并发数量增加不会导致资源耗尽、宕机。

    3. 问题:底层通信依然采用同步阻塞模型,无法从根本上解决应答消息缓慢或网络传输较慢时,长时间阻塞线程的问题。

    NIO编程

    Buffer和Channel

    1. BIO是面向流的,一次处理一个字节;NIO是面向块的,以块的形式处理数据。

    2. BIO的java.io.*已经使用NIO重新实现过。

    3. Buffer缓冲区存放着准备要写入或读出的数据。通常是一个字节数组,但也可以是其他类型的数组或不是数组。

    4. Buffer类型:

        a) ByteBuffer(常用)

        b) CharBuffer

        c) ShortBuffer

        d) IntBuffer

        e) LongBuffer

        f) FloatBuffer

        g) DoubleBuffer

    5. Channel通道是双向的,可通过它读取或写入数据。所有的数据都要通过Buffer来处理,永远不会将数据直接写入Channel。

     6. 写文件示例。

     View Code

    7. 读文件示例。

     View Code

    8. 复制文件示例。

     View Code

    深入Buffer

    1. Buffer可以理解成数组,它通过以下3个值描述状态:

        a) position:下一个元素的位置;

        b) limit:可读取或写入的元素总数,position总是小于或者等于limit;

        c) capacity:Buffer最大容量,limit总是小于或者等于capacity。

    2. 以读、写举例说明Buffer。

        a) 创建一个8字节的ByteBuffer。position=0,limit=8,capacity=8。

         b) 读取3个字节。position=3,limit=8,capacity=8。

         c) 读取2个字节。position=5,limit=8,capacity=8。

         d) 执行flip()。position=0,limit=5,capacity=8。

        e) 写入4个字节。position=4,limit=5,capacity=8。

         f) 写入1个字节。position=5,limit=5,capacity=8。

        g) 执行clear()。position=0,limit=8,capacity=8。

     3. 创建ByteBuffer的两种方法:

        a) 创建固定大小的Buffer。

    ByteBuffer.allocate(capacity)

        b) 将数组及其内容包装成Buffer。

    byte array[] = new byte[1024];
    ByteBuffer buffer = ByteBuffer.wrap(array);

    Selector

    1. Selector即IO复用模型中的多路复用器。

    2. JDK使用了epoll。

    AIO编程

    1. AIO也称NIO2.0,是异步IO模型。

    2. JDK 7时在java.nio.channels包下新增了4个异步Channel。

        a) AsynchronousSocketChannel

        b) AsynchronousServerSocketChannel

        c) AsynchronousFileChannel

        d) AsynchronousDatagramChannel

    3. 使用Future写文件:异步执行,阻塞Future.get(),直到取得结果。

     View Code

    4. 使用CompletionHandler写文件:异步执行,回调CompletionHandler。注意:示例中,由于不阻塞主线程,即异步任务是否结果主线程都会结束,有时会看不到结果,所以sleep 5秒。

     View Code

    5. 使用Future读文件:异步执行,阻塞Future.get(),直到取得结果。

     View Code

    6. 使用CompletionHandler读文件:异步执行,回调CompletionHandler。注意:示例中,由于不阻塞主线程,即异步任务是否结果主线程都会结束,有时会看不到结果,所以sleep 5秒。

     View Code

    四种IO编程对比及选择Netty的原因

    1. 对比。

    2. 选择NIO框架Netty,而不选择JDK的NIO类库的理由。

        a) NIO类库和API繁杂。

        b) 需另具备Java多线程编程等技能。

        c) 可靠性不高,工作量和难度非常大。

        d) 臭名昭著的epoll Bug导致Selector空轮训。

    Netty入门

    开发与部署

    1. 开发环境:CLASSPATH中导入“netty-all-x.y.z.jar”即可。

    2. 打包部署:由于是非Web应用,构建成jar包部署即可。

    Hello World

    1. 配置Maven的pom.xml文件。

     View Code

    2. 时间服务器TimeServer

     View Code

    3. 时间服务器TimeServerHandler

     View Code

    4. 时间客户端TimeClient

     View Code

    5. 时间客户端TimeClientHandler

     View Code

    粘包/拆包问题

    问题及其解决

    1. TCP是一个“流协议”,是没有界限的一串数据。

    2. TCP底层并不了解上层业务数据的具体含义,它会根据TCP缓冲区的实际情况进行包的划分。所以在业务上认为,一个完整的包可能会被TCP拆包发送,也可能封装多个

    小包成大包发送。

    3. 业界主流协议的解决方案归纳:

        a) 消息定长。如每个报文的大小固定长度200字节,不足时空位补空格。

        b) 在包尾增加回车换行符进行分割。如FTP协议。

        c) 将消息分为消息头、消息体,消息头中包含消息总长度(或消息体长度)的字段。

        d) 更复杂的应用层协议。

    4. Netty提供了多种编码器用于解决粘包/拆包问题。

    LineBasedFrameDecoder

    1. 原理:遍历ByteBuf中的可读字节,发现“ ”或“ ”时就结束。

    2. 支持携带结束符或不携带结束符两种编码方式;支持配置单行的最大长度(超过最大长度未发现换行符则抛出异常,同时忽略掉之前读到的异常码流)。

    3. StringDecoder功能:将接受到的对象转成字符串,然后继续调用后面的Handler。

    4. 使用LineBasedFrameDecoder优化后的时间服务器。

        a) 时间服务器TimeServer

     View Code

        b) 时间服务器TimeServerHandler

     View Code

        c) 时间客户端TimeClient

     View Code

        d) 时间客户端TimeClientHandler

     View Code

    DelimiterBasedFrameDecoder

    1. 功能:以分隔符作为码流结束标识符的消息解码。

    2. 时间服务器TimeServer

     View Code

    3. 时间服务器TimeServerHandler

     View Code

    4. 时间客户端TimeClient

     View Code

    5. 时间客户端TimeClientHandler

     View Code

    FixedLengthFrameDecoder

    1. 原理:无论一次接受到多少数据包,它都会按照设置的固定长度解码,如果是半包消息,则缓存半包消息并等待下个包到达后进行拼包,直到读取到一个完整的包。

    2. 回显服务器EchoServer

     View Code

    3. 回显服务器EchoServerHandler

     View Code

    4. 使用telnet命令测试,当长度达到20个字符时,服务器打印。

    Java序列化问题

    问题描述及其解决

    1. 无法跨语言。Java序列化是Java语言内部的私有协议,其他语言并不支持。

    2. 序列化后的码流太大。编码后的字节数组越大,存储的时候就越占空间,存储的硬件成本就越高,网络传输时更占带宽,导致系统的吞吐量降低。

    3. 序列化性能太低。编解码耗时长。

    4. 解决:编解码框架,如Google Protobuf、MessagePack。此处不深入展开。

    HTTP协议开发

    Netty HTTP

    1. 由于HTTP协议的通用性,很多异构系统间的通信交互采用HTTP协议,如非常流行的HTTP + XML或者RESTful + JSON。

    2. 与Web容器相比,Netty开发HTTP的优势:轻量级;安全。

    3. 这里以文件服务器举例,至于HTTP + XML,此处不深入展开。

    文件服务器

    1. 文件服务器HttpFileServer

     View Code

    2. 文件服务器HttpFileServerHandler

     View Code

    WebSocket协议开发

    问题及其解决

    1. 轮训、Comet等服务器推送技术效率低下,大量消耗服务器带宽和资源。

    2. WebSocket的特点:

        a) 单一的TCP连接,全双工模式。

        b) 对代理、防火墙和路由器透明。

        c) 无头部信息、Cookie和身份验证。

        d) 无安全开销。

        e) 通过“ping/pong”帧保持链路激活。

        f) 服务器可以主动传递消息给客户端,客户端不再轮训。

    原理(过程)

    1. 浏览器向服务器发起一个HTTP请求(特别的头信息,Sec-WebSocket-Key是随机的),准备建立WebSocket连接。

    复制代码
    GET /chat HTTP/1.1
    Host: server.example.com
    Upgrade: websocket
    Connection: Upgrade
    Sec-WebSocket-Key: x3JJHMbDL1EzLkh9GBhXDw==
    Sec-WebSocket-Protocol: chat, superchat
    Sec-WebSocket-Version: 13
    Origin: http://example.com
    复制代码

    2. 服务器用Sec-WebSocket-Key加上魔幻字符串“258EAFA5-E914-47DA-95CA-C5AB0DC85B11”,先SHA-1加密,再BASE-64编码,作为Sec-WebSocket-Accept返回浏览器。握手完成。

    HTTP/1.1 101 Switching Protocols
    Upgrade: websocket
    Connection: Upgrade
    Sec-WebSocket-Accept: HSmrc0sMlYUkAGmm5OPpG2HaGWk=
    Sec-WebSocket-Protocol: chat

    3. 服务器和浏览器可通过message方式进行通信。

    4. 关闭消息带有一个状态码和一个可选的关闭原因,按协议要求发送一个Close控制帧,当对端接受到关闭控制帧指令时,主动关闭WebSocket连接。

    开发

    1. 服务器WebSocketServer

     View Code

    2. 服务器WebSocketServerHandler

     View Code

    3. 浏览器websocketclient.html

     View Code

    Netty架构

    逻辑架构

    1. Netty采用三层网络架构设计和开发。

    2. Reactor通信调度层(第1层)。负责监听网络的读写和连接操作。将网络层的数据读取到内存缓存区,然后触发各种网络事件,如连接创建、连接激活、读事件、写事件等,将这些事件触发到Pipeline中,有Pipeline管理的责任链进行后续处理。

    3. 责任链ChannelPipleline(第2层)。负责事件在责任链中的有序传播,同时动态地编排责任链。通常,由编解码Handler将外部协议消息转换成内部POJO对象,这样上层业务只需关心业务逻辑处理。

    4. 业务逻辑编排层Service ChannelHandler(第3层)。通常有两类:存储的业务逻辑编排和其他应用层协议插件,用于特定协议相关的会话和链路管理。

    5. 通常,开发者值需关系责任链和业务逻辑编排层。

    高性能

    Netty的高性能是如何实现的?

    1. 采用异步非阻塞IO类库,基于Reactor模式实现,解决了传统同步阻塞IO模式下一个服务端无法平滑处理线性增长的客户端的问题。

    2. TCP接收和发送缓冲区使用直接内存代替堆内存,避免内存复制,提升了IO读写性能。俗称“零拷贝”(Zero-Copy)。

    3. 通过内存池方式循环利用ByteBuf,避免了频繁创建和销毁ByteBuf带来的性能损耗。

    4. 可配置IO线程数、TCP参数等,为不同场景提供定制化的调优参数,满足不同的性能场景。

    5. 采用环形数组缓冲区实现无锁化并发编程,代替传统的线程安全容器和锁。

    6. 合理使用线程安全容器、原子类等,提升系统的并发处理能力。

    7. 关键资源的处理使用单线程串行化方式,避免了多线程并发访问带来的锁竞争和额外的CPU资源消耗问题。

    8. 通过引用计数器及时申请释放不再被引用的对象,细粒度的内存管理降低了GC频繁,减少了频繁GC带来的延时和CPU损耗。

    可靠性

    Netty的可靠性是如何实现的?

    1. 链路有效性检测。

        a) 长连接无需每次发送消息时创建链路,也无需在消息交互完成后关闭链路,因此相对短链接更高。

        b) 为保证长连接有效性,需要周期性心跳检测。一旦发现问题,可以及时关闭链路,重建TCP链接。

    2. 内存保护机制。

        a) 通过对象引用计数器对ByteBuf等内置对象进行细粒度的内存申请和释放,对非法对象引用进行检测和保护。

        b) 通过内存池方式循环利用ByteBuf,节省内存。

        c) 可设置内存容量上限,包括ByteBuf、线程池线程数等。

    3. 优雅停机。

        a) 当系统退出时,JVM通过注册的Shutdown Hook拦截到退出信号量,然后执行退出操作,释放相关模块的资源,将缓冲区的消息处理完成或清空,将待刷新的数据持久化到磁盘或数据库,完成后再退出。

        b) 需设置超时时间T,如果达到T后仍然没有退出,则通过“kill -9 pid”强杀进程。

    可定制性

    Netty的可定制性是如何实现的?

    1. 责任链模式:ChannelPipeline基于责任链模式,便于业务逻辑的拦截、定制和扩展。

    2. 基于接口开发:关键类库都提供了接口或抽象类。

    3. 提供大量工厂类,重载工厂类可创建用户实现的对象。

    4. 提供大量系统参数供用户设置。

    可扩展性

    可定义私有协议栈。

    私有协议栈开发

    1. 开发时编写的代码。

        a) 数据结构NettyMessage;

        b) 消息编解码器NettyMessageEncoder和NettyMessageDecoder;

        c) 握手认证Handler LoginAuthReqHanlder和LoginAuthRespHanlder;

        d) 心跳检测Handler HearBeatReqHanlder和HearBeatRespHanlder。

    2. 私有协议栈细节待补充。

  • 相关阅读:
    前端生成pdf文件之pdfmake.js
    vim 安装
    linux基础学习
    python 编码处理
    Ubuntu 下配置 SSH服务全过程及问题解决
    yum 安装
    Ubuntu安装MySQL
    Linux各发行版本及其软件包管理方法
    轻松学习LINUX系列教程推出
    常用命令
  • 原文地址:https://www.cnblogs.com/Leo_wl/p/7426432.html
Copyright © 2011-2022 走看看