zoukankan      html  css  js  c++  java
  • Redis缓存雪崩和缓存穿透等问题

    穿透

    缓存穿透是指查询一个一定不存在的数据,由于缓存是不命中时需要从数据库查询,查不到数据则不写入缓存,这将导致这个不存在的数据每次请求都要到数据库去查询,造成缓存穿透。

    解决办法:①用一个bitmap和n个hash函数做布隆过滤器过滤没有在缓存的键。
           ②持久层查询不到就缓存空结果,有效时间为数分钟。

    1. 对所有可能查询的参数以hash形式存储,在控制层先进行校验,不符合则丢弃。还有最常见的则是采用布隆过滤器,将所有可能存在的数据哈希到一个足够大的bitmap中,一个一定不存在的数据会被这个bitmap拦截掉,从而避免了对底层存储系统的查询压力。
    2. 也可以采用一个更为简单粗暴的方法,如果一个查询返回的数据为空(不管是数 据不存在,还是系统故障),我们仍然把这个空结果进行缓存,但它的过期时间会很短,最长不超过五分钟。

    雪崩

    如果缓存集中在一段时间内失效,发生大量的缓存穿透,所有的查询都落在数据库上,造成了缓存雪崩。

    这个没有完美解决办法,但可以分析用户行为,尽量让失效时间点均匀分布。大多数系统设计者考虑用加锁或者队列的方式保证缓存的单线程(进程)写,从而避免失效时大量的并发请求落到底层存储系统上。


    解决办法:①用锁/分布式锁或者队列串行访问

                  ②缓存失效时间均匀分布

    1. 在缓存失效后,通过加锁或者队列来控制读数据库写缓存的线程数量。比如对某个key只允许一个线程查询数据和写缓存,其他线程等待。
    2. 可以通过缓存reload机制,预先去更新缓存,再即将发生大并发访问前手动触发加载缓存
    3. 不同的key,设置不同的过期时间,让缓存失效的时间点尽量均匀
    4. 做二级缓存,或者双缓存策略。A1为原始缓存,A2为拷贝缓存,A1失效时,可以访问A2,A1缓存失效时间设置为短期,A2设置为长期。

    热点key

    热点key:某个key访问非常频繁,当key失效的时候有大量线程来构建缓存,导致负载增加,系统崩溃。

    解决办法:

    ①使用锁,单机用synchronized,lock等,分布式用分布式锁。

    ②缓存过期时间不设置,而是设置在key对应的value里。如果检测到存的时间超过过期时间则异步更新缓存。

    ③在value设置一个比过期时间t0小的过期时间值t1,当t1过期的时候,延长t1并做更新缓存操作。

     

    缓存雪崩

      缓存雪崩是由于原有缓存失效(过期),新缓存未到期间。所有请求都去查询数据库,而对数据库CPU和内存造成巨大压力,严重的会造成数据库宕机。从而形成一系列连锁反应,造成整个系统崩溃。

      1. 碰到这种情况,一般并发量不是特别多的时候,使用最多的解决方案是加锁排队。

     public object GetProductListNew()
            {
                const int cacheTime = 30;
                const string cacheKey = "product_list";
                const string lockKey = cacheKey;
                
                var cacheValue = CacheHelper.Get(cacheKey);
                if (cacheValue != null)
                {
                    return cacheValue;
                }
                else
                {
                    lock (lockKey)
                    {
                        cacheValue = CacheHelper.Get(cacheKey);
                        if (cacheValue != null)
                        {
                            return cacheValue;
                        }
                        else
                        {
                            cacheValue = GetProductListFromDB(); //这里一般是 sql查询数据。              
                            CacheHelper.Add(cacheKey, cacheValue, cacheTime);
                        }                    
                    }
                    return cacheValue;
                }
            }    

    2. 加锁排队只是为了减轻数据库的压力,并没有提高系统吞吐量。假设在高并发下,缓存重建期间key是锁着的,这是过来1000个请求999个都在阻塞的。同样会导致用户等待超时,这是个治标不治本的方法。

      还有一个解决办法解决方案是:给每一个缓存数据增加相应的缓存标记,记录缓存的是否失效,如果缓存标记失效,则更新数据缓存。

    public object GetProductListNew()
            {
                const int cacheTime = 30;
                const string cacheKey = "product_list";
                //缓存标记。
                const string cacheSign = cacheKey + "_sign";
                
                var sign = CacheHelper.Get(cacheSign);
                //获取缓存值
                var cacheValue = CacheHelper.Get(cacheKey);
                if (sign != null)
                {
                    return cacheValue; //未过期,直接返回。
                }
                else
                {
                    CacheHelper.Add(cacheSign, "1", cacheTime);
                    ThreadPool.QueueUserWorkItem((arg) =>
                    {
                        cacheValue = GetProductListFromDB(); //这里一般是 sql查询数据。
                        CacheHelper.Add(cacheKey, cacheValue, cacheTime*2); //日期设缓存时间的2倍,用于脏读。                
                    });
                    
                    return cacheValue;
                }
            } 

    缓存标记:记录缓存数据是否过期,如果过期会触发通知另外的线程在后台去更新实际key的缓存。

      缓存数据:它的过期时间比缓存标记的时间延长1倍,例:标记缓存时间30分钟,数据缓存设置为60分钟。 这样,当缓存标记key过期后,实际缓存还能把旧数据返回给调用端,直到另外的线程在后台更新完成后,才会返回新缓存。

      这样做后,就可以一定程度上提高系统吞吐量。

     

    缓存穿透

      缓存穿透是指用户查询数据,在数据库没有,自然在缓存中也不会有。这样就导致用户查询的时候,在缓存中找不到,每次都要去数据库再查询一遍,然后返回空。这样请求就绕过缓存直接查数据库,这也是经常提的缓存命中率问题。

      解决的办法就是:如果查询数据库也为空,直接设置一个默认值存放到缓存,这样第二次到缓冲中获取就有值了,而不会继续访问数据库,这种办法最简单粗暴。

    public object GetProductListNew()
            {
                const int cacheTime = 30;
                const string cacheKey = "product_list";
    
                var cacheValue = CacheHelper.Get(cacheKey);
                if (cacheValue != null)
                    return cacheValue;
                    
                cacheValue = CacheHelper.Get(cacheKey);
                if (cacheValue != null)
                {
                    return cacheValue;
                }
                else
                {
                    cacheValue = GetProductListFromDB(); //数据库查询不到,为空。
                    
                    if (cacheValue == null)
                    {
                        cacheValue = string.Empty; //如果发现为空,设置个默认值,也缓存起来。                
                    }
                    CacheHelper.Add(cacheKey, cacheValue, cacheTime);
                    
                    return cacheValue;
                }
            }    

    把空结果,也给缓存起来,这样下次同样的请求就可以直接返回空了,即可以避免当查询的值为空时引起的缓存穿透。同时也可以单独设置个缓存区域存储空值,对要查询的key进行预先校验,然后再放行给后面的正常缓存处理逻辑。

     

    缓存预热

      缓存预热就是系统上线后,将相关的缓存数据直接加载到缓存系统。这样避免,用户请求的时候,再去加载相关的数据。

      解决思路:

        1,直接写个缓存刷新页面,上线时手工操作下。

        2,数据量不大,可以在WEB系统启动的时候加载。

        3,定时刷新缓存,

     

    缓存更新

      缓存淘汰的策略有两种:

        (1) 定时去清理过期的缓存。

        (2)当有用户请求过来时,再判断这个请求所用到的缓存是否过期,过期的话就去底层系统得到新数据并更新缓存。 

      两者各有优劣,第一种的缺点是维护大量缓存的key是比较麻烦的,第二种的缺点就是每次用户请求过来都要判断缓存失效,逻辑相对比较复杂,具体用哪种方案,大家可以根据自己的应用场景来权衡。1. 预估失效时间 2. 版本号(必须单调递增,时间戳是最好的选择)3. 提供手动清理缓存的接口。

     

    总结

      这些都是实际项目中,可能碰到的一些问题。实际上还有很多很多各种各样的问题。缓存层框架的封装往往要复杂的多。应用场景不同,方法和解决方案也不同。具体要根据实际情况来取舍。  

  • 相关阅读:
    AI工程师职业规划和学习路线完整版
    Python基础面试题库
    Python运行的17个时新手常见错误小结
    一文总结学习 Python 的 14 张思维导图
    NLP大赛冠军总结:300万知乎多标签文本分类任务(附深度学习源码)
    超过 150 个最佳机器学习,NLP 和 Python教程
    任泽平:95页PPT分析2018(经济、房价、政策)
    为什么量化交易中稳定盈利是第一要义
    使用tushare获取股票实时分笔数据延时有多大
    5行代码实现1秒内获取一次所有股票的实时分笔数据
  • 原文地址:https://www.cnblogs.com/alter888/p/8878962.html
Copyright © 2011-2022 走看看