zoukankan      html  css  js  c++  java
  • 从零开始实现简单 RPC 框架 5:网络通信之序列化

    我们在接下来会开始讲网络通信相关的内容了。既然是网络通信,那必然会涉及到序列化的相关技术。

    下面是 ccx-rpc 序列化器的接口定义。

    /**
     * 序列化器
     */
    public interface Serializer {
    
        /**
         * 序列化
         *
         * @param object 要序列化的对象
         * @return 字节数组
         */
        byte[] serialize(Object object);
    
        /**
         * 反序列化
         *
         * @param bytes 字节数组
         * @param clazz 要反序列化的类
         * @param <T>   类型
         * @return 反序列化的对象
         */
        <T> T deserialize(byte[] bytes, Class<T> clazz);
    }
    

    接口只包含序列化、反序列化两个最基础的方法。不同的序列化器只需要实现这个接口即可,再配合 SPI 就可以使用了。
    下面是 ccx-rpc 的一小段反序列化代码:

    // 获取序列化类型
    SerializeType serializeType = SerializeType.fromValue(codec);
    // 获取序列化器
    Serializer serializer = ExtensionLoader.getLoader(Serializer.class).getExtension(serializeType.getName());
    // 根据消息类型选择反序列化的 Class
    Class<?> clazz = messageType == MessageType.REQUEST.getValue() ? RpcRequest.class : RpcResponse.class;
    // 进行反序列化
    Object object = serializer.deserialize(decompressedBytes, clazz);
    

    序列化算法有多种多样,各有千秋,我们需要结合自己的业务,选择合适的序列化算法。

    序列化算法的选择通常有下列一些常用的指标:

    • 通用性:是否跨语言,跨平台。如果 RPC 调用涉及到其他语言、平台,这个指标不可忽视。
    • 性能:通常指解析速度、序列化后的大小。序列化后的数据一般用于存储或网络传输,其大小是一个很重要的指标;解析的速度无需多言,当然是越快越好。
    • 可扩展性:系统升级不可避免,某一实体的属性变更,会不会导致反序列化异常,也应该纳入序列化算法的考量范围。
    • 易用性:API 使用是否复杂,会影响开发效率。

    下面我们来看一下常见的序列化算法。

    常见序列化算法

    1. Java 序列化

    Java 序列化大家都很熟悉了,使用起来也不算复杂。先实现 Serializable,生成序列号 serialVersionUID,最后调用java.io.ObjectOutputStreamwriteObject() / readObject() 进行序列化与反序列化。

    说实话,Java 序列化虽然知道,但是还没真正去用过,这个使用步骤还是临时搜的。。。

    Java 序列化有个致命缺点:那就是不跨语言,而且性能也不太行。所以 Java 序列化很少人用,也成为了我们最熟悉的陌生人

    2. FastJson

    FastJson 是阿里开源的 JSON 解析库。正如其名,“快”是其主要卖点。从官方的测试结果来看,FastJson 确实是最快的,比 Jackson 快 20% 左右,但是近几年 FastJson 的安全漏洞比较多,而且版本升级可能会存在较大的兼容问题,所以在选择的时候,还是需要谨慎一些。
    JSON 的优点就是可读性高,但是其序列化结果的体积比较大。

    3. Jackson

    Jackson 相对 FastJson 的功能比较多,安全漏洞也比较少,社区活跃。虽然性能相对于 Jackson 稍差,但是用着安心。
    但是其序列化结果的体积比较大,对 RPC 框架来说,还是不大适合的。

    4. Kryo

    Kryo 是一个高效的 Java 序列化/反序列化库,其特点是 API 代码简单,序列化速度快,并且序列化之后得到的数据比较小。
    优点:接口易用、解析快、体积小
    缺点:只支持 Java、增删字段会异常

    5. Hessian

    Hessian 是一种支持动态类型、跨语言的序列化协议,Java 对象序列化的二进制流可以被其他语言使用。
    优点:接口易用、解析快、支持多语言
    缺点:类需要实现Serializable接口、异常机制不完善,提示信息不足

    6. Protobuf

    Google 公司开发的一套灵活、高效、自动化的、用于对结构化数据进行序列化的协议。相比于常用的 JSON 格式,Protobuf 有更高的转化效率,时间效率和空间效率都是 JSON 的 5 倍左右。Protobuf 可用于通信协议、数据存储等领域,它本身是语言无关、平台无关、可扩展的序列化结构数据格式。目前 Protobuf 提供了 C++JavaPythonGo 等多种语言的 API。
    优点:解析快、体积小、支持多语言。
    缺点:需要先定义 proto 结构,使用相对麻烦,不过 Java 可以使用 Protostuff 解决这个问题。

    总结

    在上文,我们介绍了序列化器的定义,很简单,只有序列化,反序列化两个方法。
    然后,介绍了常见的序列化算法,例如Java 序列化、FastJson、Jackson、Kryo、Hessian、Protobuf 等。这些算法各有优缺点,大家在使用时,可以结合自己的业务情况进行选择。

    ccx-rpc 代码已经开源
    Github:https://github.com/chenchuxin/ccx-rpc
    Gitee:https://gitee.com/imccx/ccx-rpc

  • 作者:小新是也
  • 链接:http://www.cnblogs.com/chenchuxin
  • 来源:博客园
  • 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
查看全文
  • 相关阅读:
    【JZOJ3360】【NOI2013模拟】苹果树
    【SDOI2009】【BZOJ1878】HH的项链
    【JZOJ3234】阴阳
    【BZOJ3482】【JZOJ3238】[COCI2013]hiperprostor 超空间旅行
    【JZOJ3348】【NOI2013模拟】秘密任务 (Standard IO) (最小割唯一性的判定)
    【JZOJ4665】【CF407E】k-d-sequence
    【SHTSC2013】阶乘字符串
    【SHTSC2013】超级跳马
    半平面交笔记
    转:Why SeaJS
  • 原文地址:https://www.cnblogs.com/chenchuxin/p/15192234.html
  • Copyright © 2011-2022 走看看