zoukankan      html  css  js  c++  java
  • 缓存设计与优化

    缓存的受益与成本

    1.受益

    • 加速读写

      • CPU L1/L2/L3 Cache、浏览器缓存、Ehcache缓存数据库结果

    • 降低后端负载

      • 后端服务器通过前端缓存降低负载:业务端使用Redis降低后端MySQL的负载

    2.成本

    • 数据不一致:缓存层和数据层有时间窗口不一致问题,和更新策略有关

    • 代码维护成本:多了一层缓存逻辑

    • 运维成本:例如Redis Cluster

    3.使用场景

    • 降低后端负载

      • 对高消耗的SQL:join结果集/分组统计结果缓存

    • 加速请求响应

      • 利用Redis/Memcache优化IO响应时间

    • 大量写合并为批量写

      • 入计数器先Redis累加再批量写DB

     

     

    缓存的更新策略

    ###1.LRU等算法剔除:例如 maxmemory-policy

    淘汰策略含义
    noeviction 当内存使用达到阈值的时候,所有引起申请内存的命令会报错
    allkeys-lru 在主键空间中,优先移除最近未使用的key
    volatile-lru 在设置了过期时间的键空间中,优先移除最近未使用的key
    allkeys-random 最主键空间中,随机移除某个key
    volatile-random 在设置了过期的键空间中,随机移除某个key
    volatile-ttl 在设置了过期时间的键空间中,具有更早过期时间的key优先移除

    2.超时剔除:例如expire

    ###3.主动更新:开发控制生命周期

    4.两条建议

    • 低一致性数据:最大内存和淘汰策略

    • 高一致性:超时剔除和主动更新结合,最大内存和淘汰策略兜底

     

     

    缓存粒度问题

    • 通用性:全量属性更好

    • 占用空间:部分属性更好

    • 代码维护:表面上全量属性更好

     

     

    缓存穿透优化

    • 含义:查询一个不存在的数据,由于缓存是不命中时需要从数据库查询,查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到数据库去查询

    • 产生原因

      • 业务代码自身问题

      • 恶意攻击、爬虫

    • 发现问题

      • 业务的响应时间,受到恶意攻击时,普遍请求被打到存储层,必会引起响应时间提高,可通过监控发现。

      • 业务本身问题

      • 相关指标:总调用数、缓存层命中数、存储层命中数

    ###解决方法1:缓存空对象(设置过期时间)

    • 含义:当存储层查询不到数据后,往cache层中存储一个null,后期再被查询时,可以通过cache返回null。

    • 缺点

      • cache层需要存储更多的key

      • 缓存层和数据层数据“短期”不一致

    • 示例代码

    public String getPassThrough(String key) {
       String cacheValue = cache.get(key);
       if( StringUtils.isEmpty(cacheValue) ) {
           String storageValue = storage.get(key);
           cache.set(key , storageValue);
           if( StringUtils.isEmpty(storageValue) ) {
               cache.expire(key , 60 * 5 );
          }
           return storageValue;
      } else {
           return cacheValue;
      }
    }

    ###解决方法2:布隆过滤器拦截(适合固定的数据)

    • 将所有可能存在的数据哈希到一个足够大的bitmap中,一个不存在的数据会被这个bitmap拦截掉,从而避免了对底层存储系统的查询压力

     

     

    缓存雪崩优化

    • 含义:由于cache服务器承载大量的请求,当cache服务异常脱机,流量直接压向后端组件,造成级联故障。或者缓存集中在一段时间内失效,发生大量的缓存穿透

    解决方法1:保证缓存高可用性

    • 做到缓存多节点、多机器、甚至多机房。

    • Redis Cluster、Redis Sentinel

    • 做二级缓存

    解决方法2:依赖隔离组件为后端限流

    • 使用Hystrix做服务降级

    解决方法3:提前演练(压力测试)

    解决方法4:对不同的key随机设置过期时间

     

     

    无底洞问题

    • 问题描述:添加机器时,客户端的性能不但没提升,反而下降

    • 问题关键点

      • 更多的机器 != 更高的性能

      • 更多的机器 = 数据增长与水平扩展

      • 批量接口需求:一次mget随着机器增多,网络节点访问次数更多。网络节点的时间复杂度由O(1) -> O(node)

    • 优化IO的方法

      • 命令本身优化:减少慢查询命令:keys、hgetall、查询bigKey并进行优化

      • 减少网络通信次数

        • mget由O(keys),升级为O(node),O(max_slow(node)) , 甚至是O(1)

      • 降低接入成本:例如客户端长连接/连接池、NIO等

     

     

    热点Key的重建优化

    • 热点Key(访问量比较大) + 较长的重建时间(重建过程中的API或者接口比较费时间)

    • 导致的问题:有大量的线程会去查询数据源并重建缓存,对存储层造成了巨大的压力,响应时间会变得很慢

    1.三个目标

    • 减少重建缓存的次数

    • 数据尽可能一致

    • 减少潜在危险:例如死锁、线程池大量被hang住(悬挂)

    2.两种解决方案

    • 互斥锁(分布式锁)

      • 第一个线程需要重建时候,对这个Key的重建加入分布式锁,重建完成后进行解锁

      • 这个方法避免了大量的缓存重建与存储层的压力,但是还是会有大量线程的阻塞

      jedis.set(lockKey, requestId, SET_IF_NOT_EXIST, SET_WITH_EXPIRE_TIME, expireTime)

      String get(String key) {
         String SET_IF_NOT_EXIST = "NX";
         String SET_WITH_EXPIRE_TIME = "PX";
         
         String value = jedis.get(key);
         if( null == value ) {
             String lockKey = "lockKey:" + key;
             if( "OK".equals(jedis.set(lockKey , "1" , SET_IF_NOT_EXIST ,
                           SET_WITH_EXPIRE_TIME , 180)) ) {
                 value = db.get(key);
                 jedis.set(key , value);
                 jedis.delete(lockKey);
            } else {
                 Thread.sleep(50);
                 get(key);
            }
        }
         return value;
      }
    • 永远不过期

      • 缓存层面:不设置过期时间(不使用expire)

      • 功能层面:为每个value添加逻辑过期时间,单发现超过逻辑过期时间后,会使用单独的线程去重建缓存。

      • 还存在一个数据不一致的情况。可以将逻辑过期时间相对实际过期时间相对减小

    缓存的受益与成本

    1.受益

    • 加速读写

      • CPU L1/L2/L3 Cache、浏览器缓存、Ehcache缓存数据库结果

    • 降低后端负载

      • 后端服务器通过前端缓存降低负载:业务端使用Redis降低后端MySQL的负载

    2.成本

    • 数据不一致:缓存层和数据层有时间窗口不一致问题,和更新策略有关

    • 代码维护成本:多了一层缓存逻辑

    • 运维成本:例如Redis Cluster

    3.使用场景

    • 降低后端负载

      • 对高消耗的SQL:join结果集/分组统计结果缓存

    • 加速请求响应

      • 利用Redis/Memcache优化IO响应时间

    • 大量写合并为批量写

      • 入计数器先Redis累加再批量写DB

     

     

    缓存的更新策略

    ###1.LRU等算法剔除:例如 maxmemory-policy

    淘汰策略含义
    noeviction 当内存使用达到阈值的时候,所有引起申请内存的命令会报错
    allkeys-lru 在主键空间中,优先移除最近未使用的key
    volatile-lru 在设置了过期时间的键空间中,优先移除最近未使用的key
    allkeys-random 最主键空间中,随机移除某个key
    volatile-random 在设置了过期的键空间中,随机移除某个key
    volatile-ttl 在设置了过期时间的键空间中,具有更早过期时间的key优先移除

    2.超时剔除:例如expire

    ###3.主动更新:开发控制生命周期

    4.两条建议

    • 低一致性数据:最大内存和淘汰策略

    • 高一致性:超时剔除和主动更新结合,最大内存和淘汰策略兜底

     

     

    缓存粒度问题

    • 通用性:全量属性更好

    • 占用空间:部分属性更好

    • 代码维护:表面上全量属性更好

     

     

    缓存穿透优化

    • 含义:查询一个不存在的数据,由于缓存是不命中时需要从数据库查询,查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到数据库去查询

    • 产生原因

      • 业务代码自身问题

      • 恶意攻击、爬虫

    • 发现问题

      • 业务的响应时间,受到恶意攻击时,普遍请求被打到存储层,必会引起响应时间提高,可通过监控发现。

      • 业务本身问题

      • 相关指标:总调用数、缓存层命中数、存储层命中数

    ###解决方法1:缓存空对象(设置过期时间)

    • 含义:当存储层查询不到数据后,往cache层中存储一个null,后期再被查询时,可以通过cache返回null。

    • 缺点

      • cache层需要存储更多的key

      • 缓存层和数据层数据“短期”不一致

    • 示例代码

    public String getPassThrough(String key) {
       String cacheValue = cache.get(key);
       if( StringUtils.isEmpty(cacheValue) ) {
           String storageValue = storage.get(key);
           cache.set(key , storageValue);
           if( StringUtils.isEmpty(storageValue) ) {
               cache.expire(key , 60 * 5 );
          }
           return storageValue;
      } else {
           return cacheValue;
      }
    }

    ###解决方法2:布隆过滤器拦截(适合固定的数据)

    • 将所有可能存在的数据哈希到一个足够大的bitmap中,一个不存在的数据会被这个bitmap拦截掉,从而避免了对底层存储系统的查询压力

     

     

    缓存雪崩优化

    • 含义:由于cache服务器承载大量的请求,当cache服务异常脱机,流量直接压向后端组件,造成级联故障。或者缓存集中在一段时间内失效,发生大量的缓存穿透

    解决方法1:保证缓存高可用性

    • 做到缓存多节点、多机器、甚至多机房。

    • Redis Cluster、Redis Sentinel

    • 做二级缓存

    解决方法2:依赖隔离组件为后端限流

    • 使用Hystrix做服务降级

    解决方法3:提前演练(压力测试)

    解决方法4:对不同的key随机设置过期时间

     

     

    无底洞问题

    • 问题描述:添加机器时,客户端的性能不但没提升,反而下降

    • 问题关键点

      • 更多的机器 != 更高的性能

      • 更多的机器 = 数据增长与水平扩展

      • 批量接口需求:一次mget随着机器增多,网络节点访问次数更多。网络节点的时间复杂度由O(1) -> O(node)

    • 优化IO的方法

      • 命令本身优化:减少慢查询命令:keys、hgetall、查询bigKey并进行优化

      • 减少网络通信次数

        • mget由O(keys),升级为O(node),O(max_slow(node)) , 甚至是O(1)

      • 降低接入成本:例如客户端长连接/连接池、NIO等

     

     

    热点Key的重建优化

    • 热点Key(访问量比较大) + 较长的重建时间(重建过程中的API或者接口比较费时间)

    • 导致的问题:有大量的线程会去查询数据源并重建缓存,对存储层造成了巨大的压力,响应时间会变得很慢

    1.三个目标

    • 减少重建缓存的次数

    • 数据尽可能一致

    • 减少潜在危险:例如死锁、线程池大量被hang住(悬挂)

    2.两种解决方案

    • 互斥锁(分布式锁)

      • 第一个线程需要重建时候,对这个Key的重建加入分布式锁,重建完成后进行解锁

      • 这个方法避免了大量的缓存重建与存储层的压力,但是还是会有大量线程的阻塞

      jedis.set(lockKey, requestId, SET_IF_NOT_EXIST, SET_WITH_EXPIRE_TIME, expireTime)

      String get(String key) {
         String SET_IF_NOT_EXIST = "NX";
         String SET_WITH_EXPIRE_TIME = "PX";
         
         String value = jedis.get(key);
         if( null == value ) {
             String lockKey = "lockKey:" + key;
             if( "OK".equals(jedis.set(lockKey , "1" , SET_IF_NOT_EXIST ,
                           SET_WITH_EXPIRE_TIME , 180)) ) {
                 value = db.get(key);
                 jedis.set(key , value);
                 jedis.delete(lockKey);
            } else {
                 Thread.sleep(50);
                 get(key);
            }
        }
         return value;
      }
    • 永远不过期

      • 缓存层面:不设置过期时间(不使用expire)

      • 功能层面:为每个value添加逻辑过期时间,单发现超过逻辑过期时间后,会使用单独的线程去重建缓存。

      • 还存在一个数据不一致的情况。可以将逻辑过期时间相对实际过期时间相对减小

      •  

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

  • 相关阅读:
    个人便签
    秒杀系统架构分析与实战
    NPOI大数据分批写入同个Excel
    js获取鼠标坐标位置兼容多个浏览器
    月薪3万的程序员都避开了哪些坑
    怎样理解阻塞非阻塞与同步异步的区别?
    JS中的prototype
    互联网——降级论
    fedora自带OpenJDK,所以如果安装官方的JDK的话要先删除OpenJDK
    cygwin 安装完后不能进入think问题,网上99%都是错误的
  • 原文地址:https://www.cnblogs.com/dwvfw855/p/10912565.html
Copyright © 2011-2022 走看看