zoukankan      html  css  js  c++  java
  • Java系统性能优化实战读书笔记

    前言

    我是个喜欢看电子书的人,因为可以边看边记笔记,写感言,对书中精彩的地方进行学习实践,
    非常感谢本书作者家智老师,分享了这本书的最新电子版,让我有机会能阅读本书!

    本书正版链接:
    Java系统性能优化实战

    一周目

    1 java系统优化

    1 一段代码的优化

    // 原代码
    public Map buildArea(List<Area> areas){
         if(areas.isEmpty()){
             return new HashMap();
         }
         Map<String,Area> map = new HashMap<>();
         for(Area area:areas){
             String key = area.getProvinceId()+"#"+area.getCityId();
             map.put(key,area);
         }
         return map;
    }
    
    1. 代码重构往往遗漏了注释, 如果代码改动,会给阅读者造成负担和困惑
    2. String作为Map的key,在某些情况下并非最优解,尤其是key需要字符串拼接等场景,Object在某些情况下可能性能更好
    3. 很多方法条件判断不满足,直接返回一个 new List等,可以返回一个初始化好的,不必每次创建一个空的集合,(需要注意返回的map是否还有其他操作,没有则可以)
    4. 构造map时,如果知道其长度可以指定一个size,避免不必要的扩容(扩容时间消耗较大)

    2 使用jvisualvm抽样器,获取每个类每个方法的执行时间

    可以分析程序中哪个方法耗时最长,是否需要优化等,抽样中可以点击快照,保存当时的采样情况:

    抽样器还可以自定义设置分析的包以及频率,这对于验证某些jdk方法的耗时非常有用:

    3 JMH

    是专门用于代码微基准测试的工具套件。主要是基于方法层面的基准测试,精度可以达到纳秒级。当你定位到热点方法,希望进一步优化方法性能的时候,就可以使用JMH对优化的结果进行量化的分析。
    demo:

    @BenchmarkMode(Mode.Throughput) // 使用模式,Throughput表示吞吐量,AverageTime每次执行时间
    @Warmup(iterations = 3)   //配置预热次数,默认是每次运行1秒,iterations:运行次数
    @Measurement(iterations = 3, time = 5, timeUnit = TimeUnit.SECONDS) // 配置运行次数,time:每次运行时间
    @Threads(1)  // 配置多少个线程
    @Fork(1)  //  代表启动多少个单独的进程去测试每个方法
    @OutputTimeUnit(TimeUnit.SECONDS) // 统计结果的时间单元, 即每秒的 吞吐量
    public class MyBenchmark {
    
        // 使用静态内部类,包含测试中使用的全部实例对象,可以用@State 标识对象的生命周期,JMH会决定是共用一个,还是每个线程都是一个新的
        @State(Scope.Benchmark)
        public static class SharedPara{
            AreaService areaService = new AreaService();
            PreferAreaService perferAreaService = new PreferAreaService();
            List<Area> data = buildData(20);
            private List<Area> buildData(int count){
                List<Area> list = new ArrayList<>(count);
                for(int i=0;i<count;i++){
                    Area area = new Area(i,i*10);
                    list.add(area);
                }
                return list;
            }
    
            /**
             * Level.Tiral: 运行每个性能测试的时候执行,推荐的方式,相当于只运行一次。
             * Level.Iteration, 每次运行迭代的时候执行
             * Level.Invocation,每次调用方法的时候执行,这个选项需要谨慎使用
             */
            @Setup(Level.Invocation)
            public void init(){
                //测试前的初始化,比如加载一个测试脚本
            }
        }
    
        /**
         *  @Benchmark 标注两个需要比较的方法
         *  注意:
         *  1 为了避免虚拟机优化,所有测试方法都需要定义返回值,并且返回,
         *  所以测试最好可以提供了一个baseline,即没有返回值的方法, 来检查是否方法被虚拟机优化而影响测试结果
         *  2 尽量不要使用常量,或者返回常量(或者final类型),JIT会认为他是常量而直接优化
         */
        @Benchmark
        public static void testStringKey(SharedPara para){
            //优化前的代码,使用  String拼接为key
            para.areaService.buildArea(para.data);
        }
        @Benchmark
        public static void testObjectKey(SharedPara para){
            //要测试的优化后代码,使用Object为key
            para.perferAreaService.buildArea(para.data);
        }
    
    
        public static void main(String[] args) throws RunnerException {
            // include接受一个字符串表达式,表示需要测试的类和方法
            // OptionsBuilder 也有类上注解的那些api可以直接调用
            Options opt = new OptionsBuilder()
                    .include(MyBenchmark.class.getSimpleName())
                    .build();
            // 执行测试,
            new Runner(opt).run();
        }
    }
    
    

    执行结果说明:

    mode,可以在@BenchmarkMode注解中改变,测试执行时间等

    2 字符串和数字

    1. 通过字节数组构造字符串是比较消耗CPU的,在设计分布式系统需要传输的字段时,尽量避免用String,比如时间用long,状态用int等
    2. 使用StringBuilder拼接其他类型,尤其是数字,性能会明显下降,因为Int转String至少需要50行代码,使用的时候需要考虑
    3. SLF4J 框架使用 {},来进行拼接,但是使用Format性能比直接拼接差(这也是很多开源框架不使用SLF4J的原因),考虑性能还是直接使用以下方式:
    if(logger.isDebugEnable()){
      logger.debug("订单id "+ id +" 用户 "+name+" 订单状态 "+status);
    }
    
    1. String如果是查找单个字符,那么建议使用相应的接受char为参数的API,而不是String为参数的API,比如 String.indexOf('t')性能就好与String.indexOf("t").
    2. 关键字过滤,可以使用前缀树过滤,而不使用for循环replace,来提升性能
    3. 过多的数字装箱会创建对象,对垃圾回收增加负担,可以使用IntStream来进行int操作,避免使用集合等
    4. 在设计精度计算的时候,long类型比BigDecimal类型性能更好,大约四倍

    4 代码性能优化

    1. 如果系统中有int转String的操作,可以提前将一部分int预先转化,作为缓存,int转String比较耗时,(原理跟Integer的装箱缓存类似)
    2. SimpleDateFormat类是非线程安全的,如果每次转换都需要new一个,性能比较差,可以使用ThreadLocal优化,从threadlocal中获取,或者使用DateTimeFormatter,线程安全
    3. 尽量避免使用异常,异常会导致性能降低(Java代码构造异常对象需要一个填写异常栈得操作),应该使用定义的错误码
    4. 循环展开可以提高性能,即减少循环次数,比如:
    // 需要注意,这样 tasks就必须是4的倍数,如果不是,则就需要一定的预处理
    List<Task> tasks = ....;
    initTask(tasks)
    for(int i=0;i<tasks.length;){
      tasks[i++].execute();
      tasks[i++].execute();
      tasks[i++].execute();
      tasks[i++].execute();
    }
    
    
    1. 枚举的map使用用EnumMap性能会更好,同时微服务之间交互,尽量返回java的自带类型,不应该返回自定义类型,避免序列化,比如不返回枚举,返回String
    2. 位运算非常高效,优先考虑使用位运算
    3. 微服务调用中,压缩可以提高传输的速度,尽量减少属性key的长度,比如orderId可以用oid,可以用一个int,用位来表示多个状态
    4. 衡量消耗的时间最好使用System.nanoTime() 方法,nanoTime不是现实时间,是一个虚拟机提供的计时时间,精确到纳秒
    5. 生成随机数,可以使用ThreadLocalRandom,他在当前线程维护了一个种子,适合在多线程场景下提供高性能伪随机数生成
    6. Java8提供了java.util.Base64,在转化base64这块性能远远高于apache等的其他工具类
    7. 如果对象没有实现hashCode方法,系统返回默认的hashCode,与 System.identityHashCode(obj) 返回的一致System.identityHashCode(obj) 默认实现与虚拟机有关,其性能不高,最好的情况是自己实现高效的hashCode方法,并缓存计算好的hashCode

    5 高性能工具

    1. 本地缓存: Caffeine
    2. 对象复制: selma
    3. Json工具:Jackson
    4. 数据库连接池: HikariCP (源码设计优化非常出色,后面阅读)
    5. 文本处理: Beetl
    6. 高性能反射工具:ReflectASM

    7 可读性代码

    1. 使用临时变量不会影响性能,与其直接返回方法,不会先定义一个临时变量,然后返回,这样更容易阅读

    2. 不需要在代码中备注修改历史,git会记录修改记录

    3. 尽量不要用null,无论是入参还是返回值

    8 代码优化案例

    1. String类的搜索和replace,append,如果只是单个字符,可以使用性能更好的char参数方式
    // char参数方法性能更好
    int index = str.indexOf('{');
    StringBuilder sb = new StringBuilder();
    sb.append('{').....append(':')....apend('}')
    

    2.StringBuilder拼接,如果知道容量,可以在new对象的时候指定容量,同时,如果有int转String,可以提前使用缓存,避免转化消耗性能

    //建立一个缓存
    static int cacheSize = 1024;
    static String[] caches = new String[cacheSize];
    static {
      for(int i=0;i<cacheSize;i++){
        caches[i] = String.valueOf(i);
      }
    }
    
    1. 方法的入参和出参最好都使用对象,来代替map,map难以阅读
    2. 排序问题,如果自定义排序中,每次都要调用String.equals方法,则可以在类中增加排序依据属性,构造的时候就调用equasl,排序直接根据属性判断:
    // 优化前:
    Collections.sort(list,new Comparator<Task>(){
      @Override
      public int compare(Task a,Task b){
      if(a.getName.equals("start")){
        return 1
        }else if(a.getName.equals("end")){
        return -1
        }else{
        }
      }
    })
    // 优化后:
    // 定义排序依据
    public class Task{
      String name = null;
      boolean start;
      boolean end;
      public Task(String name){
        this.name = name;
        if(name.equals("start")){
        start = true;
        }else if(name.equals("end")){
        end = true;
        }
      }
    }
    
    // 排序:
    public int compare(Task a,Task b){
      if(a.isStart()){
        return 1
      }else if(a.isEnd()){
        return -1
      }else{
    
    1. 对于特殊ID的判断,没有必要每次都转为String, int转String会消耗性能,可以用其他方法代替
    2. 在代码中有多个条件判断时,优先处理异常情况,即先if判断,失败的代码,再写继续执行的逻辑代码
    3. 遍历map,使用map.entrySet() 遍历性能更高
    4. SimpleDateFormat是一个线程非安全类,工具类定义一个static属性,没用,必须每个方法都new一个,但是这样会影响性能,可以使用ThreadLocal:
    private ThreadLocal<SimpleDateFormat> local = new ThreadLocal<SimpleDateFormat>(){
      protected SimpleDateFormat initialValue(){
      return new SimpleDateFormat("yyyy-MM-dd");
    }
    };
    //调用方法,从threadlocal获取
    public String format(Date d){
      return local.get().format(d);
    }
    
    1. 打印日志时候,使用拼接,不适用占位符,原因在于log日志框架内部会有一个把占位符号{}替换成目标变量耗时过程。考虑到info级别有可能频繁调用,对性能有影响,因此建议直接使用字符串输出
    2. for循环调用,性能可以稍微优化:
    //优化前:
    for(int i=0;i<list.size();i++){
    }
    // 优化后:定义好size,不用每次判断
    for(int i=0,size=list.size();i<size;i++){
    }
    
    1. 在使用lock的时候,应该定义成类变量,同时一定要try catch finally,保证释放所资源
    2. Java字符集使用Charset对象表示
    3. 开关判断的优化,如果从配置中获取某个值,有if判断,比如:
    public int getInt(String key){
      if(config.contains(key)){
      return (Integer)config.get(key);
      }
      //.......
    }
    

    则可以将if条件去掉:

    public int getInt(String key){
      Integer a = (Integer)config.get(key);
      if(a!=null){
      return a;
      }
      //.......
    }
    
    1. UUID 使用replaceAll去除-的优化
      String uuidStr = UUID.randomUUID().toString();
      String shortUuidStr = uuidStr.replaceAll("-","");
      UUID的格式如下:
      123e4567-e89b-12d3-a456-426655440000
      通常业务中会去除-,使用replace,这对性能影响很大
      通过查看源码可以发现,此处-是UUID的toString方法拼接的,因此,我们可以自己实现一个自定义UUID方法,只需要重写toString方法即可,性能会有较大提升

    10 ASM运行时增强

    关于ASM工具的内容,我详细写在了另外一篇博客中:
    ASM库的使用

    11 JSR269编译时增强

    关于JSR269的内容,我也详细写在了另外一篇博客中:
    JSR269的使用

    12 OQL分析JVM内存

    13 代码的9种性能优化方式

    被惊艳到的YYDS

    1 JMH工具的使用
    对于工作中需要做一些代码优化,或者引入新的组件这些工作时,这个工具非常有用,可以直接测试新旧代码的性能对比,从而了解到代码优化带来的性能提升程度

    2 for循环的一个小小优化:

    //优化前:
    for(int i=0;i<list.size();i++){
    }
    // 优化后:定义好size,不用每次判断
    for(int i=0,size=list.size();i<size;i++){
    }
    

    3 JSR269

    4 OQL内存分析工具

    读后感

    在读这本书的时候,总是能时刻感受到作者严谨的逻辑思维与精妙的编程技巧,也在阅读和跟着书中例子实际测试的过程中,收获了很多编程技巧和实用的工具,都是自己不曾了解过的!
    记得在17年刚工作的时候,当时领导见到我的第二个问题就是,你有自己的编程思想吗,对于当时的我,还不太理解什么是自己的编程思想,现在想来,因为这个不理解,在刚工作的一两年内犯了很多可以避免的错误,可以说那个时候的自己是一个没有思想的行尸码农!
    对于一个即使很小的开发功能而言,有的人,复用之前的老代码,改改就好,有的人,匆匆忙忙写了一大堆重复代码,似乎只是为了完成开发任务,同样的一个任务,两个人的处理方式为什么截然不同,我想,他们的行为不同是因为他们编程思想的不同!

    那么有时候我在想,我的编程思想到底是什么样的呢?
    是不断的学习新技术吗,读电子书,读技术文档,看视频教程,很多又用不到,刚开始工作的几年,的确恶补了很多开源技术,但是这是个无底洞
    是不断的钻研源码,比如jdk源码,spring源码,但这是一个非常大的工程,稍有不慎,就是从努力到放弃
    是不断的画饼,名其名曰职业规划,然后一下子下载了十几本书,告诉自己今年内看完,然后就会觉得生活很充实,但是很容易眼高手低
    实际在工作中碰到的很多大牛,其实并没有很多新技术储备,但是在一个技术难题上,总能给出比我想的要好的解决方案,
    在产品的需求评审中,总能提出来很多需求的缺陷,而我只能静静的当一个旁观者!
    他们确实比我年龄大,但是你也不能把这完全归功于人生阅历,或者对现有系统业务更熟悉,毕竟牛顿在22岁就发现了万有引力,毕竟对系统熟悉的人有很多,我想这已经不能是一种技术能力,而是一种思维模式,即编程思想!

    回顾刚开始工作的前两年,因为技术储备有限,而优先学习了很多的框架,那段实践的确技术上有了很大的进步,可是对于每一次需求评审,还是在原地踏步,
    之后的一年,因为在互联网,开始把之前学习到技术实践在了工作中,在实践中遇到了很多学习中根本不会发现的问题,也发现了学习始终是学习,不能只学习!
    也开始在看每一次需求原型时,开始思考,这个需求的可行性,就像小时候下的象棋,这个责任其实很多时候是组长和领导们的,但是只要你有想法,兵也能当将!
    也开始读完没一本书,学习完每一个技术,都开始写博客,写总结,反思,谈收获,这个习惯一直坚持到今天,这对于我而言,是一个非常重要的习惯,因为工作中我就经常翻看自己以前的博客来解决问题的思路,
    这就像是我的错题本,也是我的知识宝库!

    最近的这一年,由于开始谈恋爱,我其实并没有学习很多新技术,但是在工作中感觉反而更加的游刃有余,更轻松,我想很重要的一点是自己慢慢形成了“编程思想”:
    我觉得可以归为四点:
    学以致用,学而思,好记性不如烂笔头,努力做一位极客

    1 所有大牛都是小白学习过来,但是为什么有的人成为了大牛,有的人还是代码的搬运工,其实很多人有一个误区,就是在面试之前学习应付面试,面试后就躺平了,而真正的学习技术,应该是需要去及时使用它,这样才能检验出你学习的掌握程度,倘若你短期内用不到这个技术,那么我建议你还是三思,因为时间不等人,清晰的方向比努力更优先,当然,时间充足的情况下,你还是可以努力钻研更多的技术,但是这是一杆秤,你给予学习的时间越多,就意味着你留给家人和爱人的时间越少!
    2 很多人看完一本书,写几个hello world,就自我感觉良好,觉得生活又充实了,后续工作中碰到很多问题又焦头烂额,我时常告诫自己,千万不能这样,看完一本书,一定要思考总结,这本书给我的启发,以及这些技术对于我现在的工作中有哪些帮助,可以做哪些优化和尝试!
    3 我有一个习惯,记笔记,对于这个快节奏的时代,很多人看视频都是二倍速的,所以当你忘记已经读过的一本书或者技术文档的时候,你当然可以选择再看一遍,而我选择重翻我的笔记!我记笔记有好几年了,最开始在码云上用xmind,到后来的博客园,在到后来的博客园的md,做了各种不同的尝试,从最初的贴代码截图,记录非常多的内容,到后面开始新建码云项目,将代码和笔记放一块,到最后精简提炼内容,写在博客园,慢慢形成了现在你看到的这种笔记,但是记笔记的同时也会伴随着巨大的时间成本,所以记笔记一定要快,准,狠!
    4 工作中经常会有一个开发任务,因为之前的代码有模板,所以为了应付,而直接ctrl c ctrl v,这其实是一个很好的机会,系统架构的机会,代码重构的机会,性能优化的机会,项目改造的机会,写出极致优雅代码的机会,这是你读一本书,花几千块在培训机构学不到的机会,这个时候应该努力做一位极客,首先做架构设计,全面了解需求,做出可扩展的优秀设计,并不着急先写代码,你甚至可以自己创造一个新的技术来实现这个功能,提高自己的内卷力!

    最后我想回答一下刚开始工作的时候领导问过我的那个问题,你有自己的编程思想吗?

    我可能不会永远在这一行干下去,但我会记住每个在工作中帮助纠正过我的人,他们让我更深刻的懂得,学习贵在坚持,选择大于努力,机会决定高度!

  • 相关阅读:
    HTML5 Shiv – 让该死的IE系列支持HTML5吧(转)
    sql之left join、right join、inner join的区别
    一道JS的简单算法题
    逆波兰式计算字符串公式
    前端编程,语义化
    罗列各种排序Mark
    关于JS动画和CSS3动画的性能差异
    各种算法题MARK
    Html笔记【不定时更新】
    CSS3笔记【不定时更新】
  • 原文地址:https://www.cnblogs.com/houzheng/p/15526299.html
Copyright © 2011-2022 走看看