zoukankan      html  css  js  c++  java
  • [JDK8]性能优化之使用LongAdder替换AtomicLong

    如果让你实现一个计数器,有点经验的同学可以很快的想到使用AtomicInteger或者AtomicLong进行简单的封装。

    因为计数器操作涉及到内存的可见性和线程之间的竞争,而Atomic***的实现完美的屏蔽了这些技术细节,我们只需要执行相应的方法,就能实现对应的业务需求。

    Atomic**虽然好用,不过这些的操作在并发量很大的情况下,性能问题也会被相应的放大。我们可以先看下其中getAndIncrement的实现代码

    public final long getAndIncrement() {
        return unsafe.getAndAddLong(this, valueOffset, 1L);
    }
    
    // unsafe类中的实现
    public final long getAndAddLong(Object var1, long var2, long var4) {
        long var6;
        do {
            var6 = this.getLongVolatile(var1, var2);
        } while(!this.compareAndSwapLong(var1, var2, var6, var6 + var4));
    
        return var6;
    }

    很显然,在getAndAddLong实现中,为了实现正确的累加操作,如果并发量很大的话,cpu会花费大量的时间在试错上面,相当于一个spin(自旋)的操作。如果并发量小的情况,这些消耗可以忽略不计。

    既然已经意识到Atomic***有这样的业务缺陷,Doug Lea大神又给我们提供了LongAdder,内部的实现有点类似ConcurrentHashMap的分段锁,最好的情况下,每个线程都有独立的计数器,这样可以大量减少并发操作。

    下面通过JMH比较一下AtomicLong 和 LongAdder的性能。

    @OutputTimeUnit(TimeUnit.MICROSECONDS)
    @BenchmarkMode(Mode.Throughput)
    public class Main {
    
        private static AtomicLong count = new AtomicLong();
        private static LongAdder longAdder = new LongAdder();
        public static void main(String[] args) throws Exception {
            Options options = new OptionsBuilder().include(Main.class.getName()).forks(1).build();
            new Runner(options).run();
        }
    
        @Benchmark
        @Threads(10)
        public void run0(){
            count.getAndIncrement();
        }
    
        @Benchmark
        @Threads(10)
        public void run1(){
            longAdder.increment();
        }
    }

    1、设置BenchmarkMode为Mode.Throughput,测试吞吐量
    2、设置BenchmarkMode为Mode.AverageTime,测试平均耗时

    线程数为1

    1、吞吐量

    Benchmark   Mode  Cnt    Score   Error   Units
    Main.run0  thrpt    5  154.525 ± 9.767  ops/us
    Main.run1  thrpt    5   89.599 ± 7.951  ops/us

    2、平均耗时

    Benchmark  Mode  Cnt  Score    Error  Units
    Main.run0  avgt    5  0.007 ±  0.001  us/op
    Main.run1  avgt    5  0.011 ±  0.001  us/op

    单线程情况:
    1、AtomicLong的吞吐量和平均耗时都占优势

    线程数为10

    1、吞吐量

    Benchmark   Mode  Cnt    Score     Error   Units
    Main.run0  thrpt    5   37.780 ±   1.891  ops/us
    Main.run1  thrpt    5  464.927 ± 143.207  ops/us

    2、平均耗时

    Benchmark  Mode  Cnt  Score   Error  Units
    Main.run0  avgt    5  0.290 ± 0.038  us/op
    Main.run1  avgt    5  0.021 ± 0.001  us/op

    并发线程为10个时:

    • LongAdder的吞吐量比较大,是AtomicLong的10倍多。
    • LongAdder的平均耗时是AtomicLong的十分之一。

    线程数为30

    1、吞吐量
    Benchmark   Mode  Cnt    Score    Error   Units
    Main.run0  thrpt    5   36.215 ±  2.341  ops/us
    Main.run1  thrpt    5  486.630 ± 26.894  ops/us

    2、平均耗时

    Benchmark  Mode  Cnt  Score   Error  Units
    Main.run0  avgt    5  0.792 ± 0.021  us/op
    Main.run1  avgt    5  0.063 ± 0.002  us/op

    线程数为30个时:

    • LongAdder的吞吐量比较大,也是AtomicLong的10倍多。
    • LongAdder的平均耗时也是AtomicLong的十分之一。

    总结

    一些高并发的场景,比如限流计数器,建议使用LongAdder替换AtomicLong,性能可以提升不少。

  • 相关阅读:
    vue, 同一个页面有多处地方需要上传图片
    单张图片上传,vue
    replace 替换只会替换找到的第一个字符
    vue ant design table中rowSelection属性的应用
    一般做页面时需要注意的事项
    vue 为form 表单赋值 获取form表单的值
    vue 父子组件中的传值
    vue 页面跳组件,实现点击浏览器自带返回箭头,返回到上一个页面,而不是返回道上个路由
    vue ant design a-table 的分页
    初建vuex项目
  • 原文地址:https://www.cnblogs.com/Joy-Hu/p/10715682.html
Copyright © 2011-2022 走看看