zoukankan html css js c++ java

Redis1 介绍linux安装配置, 使用场景, redis-API的使用(通用命令, 五大数据类型), redis高级用法(慢查询优化, 管道[实现事务功能], 发布订阅, Bitmap位图, HyperLogLog)

Redis 介绍安装配置

#1  只有5种数据结构：
    -多种数据结构：字符串，hash，列表，集合，有序集合
#2  单线程，速度为什么这么快？
    -本质还是因为是内存数据库
  -epoll模型（io多路复用）
  -单线程，没有线程，进程间的通信
# 3 linux上 安装redis#下载　　(测试放在/home/ldc路径下)
  wget http://download.redis.io/releases/redis-5.0.7.tar.gz
  #解压
  tar -xzf redis-5.0.7.tar.gz
  #建立软连接  (相当于建立快捷方式，直接cd就能进去)
  ln -s redis-5.0.7 redis    # 当前路径下会有redis文件夹
  cd redis
  make&&make install    # 编译和安装两步并一步
  
  # bin路径下几个命令：redis-cli,redis-server,redis-sentinel (cd到redis里的src文件夹中，能看到命令，可以敲命令使用)
  # 在任意位置能够执行redis-server 如何做？配置环境变量 (经测试这里redis自动加入环境变量中)
  
  #4  启动redis的三种方式
      -方式一：(一般不用，没有配置文件)
        -redis-server
    -方式二：（用的也很少）    # 以6380端口打开
        redis-server --port 6380
    -方式三：（都用这种，配置文件）   # cat redis.conf查看配置文件，下面为内部重要参数
    　　daemonize yes#是否以守护进程启动
    　　pidfile /var/run/redis.pid#进程号的位置，删除
    　　port 6379#端口号
    　　dir "/opt/soft/redis/data"#工作目录(数据存放的目录)
    　　logfile 6379.log#日志位置  
          
      # vim redis.conf1 编写新的配置文件，写入上面5行重要参数 (注意命令结尾不要空格，可以写注释。经过测试，删掉注释才能识别。。。)
      # 启动：redis-server redis.conf1 
　　　　(Can't chdir to '/opt/soft/redis/data': No such file or directory报错。创建对应的文件夹路径，然后回到redis.conf1路径下)
  #5 客户端连接
  redis-cli -h 127.0.0.1 -p 6379
  # 查看进程是否存在
  ps -ef |grep redis-server |grep 6379
  # 参看日志
  cat 6379.log

使用场景

缓存系统：使用最广泛的就是缓存

计数器：网站访问量，转发量，评论数（文章转发，商品销量，单线程模型【一个个执行，不会出现并发问题】）

消息队列：发布订阅，阻塞队列实现（简单的分布式，blpop：阻塞队列，生产者消费者）

排行榜：有序集合（阅读排行，点赞排行，推荐（销量高的，推荐））

社交网络：很多特效跟社交网络匹配，粉丝数，关注数

实时系统：垃圾邮件处理系统，布隆过滤器

redis-API的使用

# 介绍，安装，启动，应用场景
在配置文件中添加：允许远程登陆（windows连接测试,redis没设密码，不用添加下面参数也能连）
bind 0.0.0.0
protected-mode no
requirepass 123456    # 可加可不加

#1  通用命令
####1-keys 
#打印出所有key
keys *     (少用，慢查询。数据多，会特别慢)
#keys命令一般不在生产环境中使用，生产环境key很多，时间复杂度为o(n),用scan命令

####2-dbsize   计算key的总数
dbsize  
#redis内置了计数器，插入删除值该计数器会更改，所以可以在生产环境使用，时间复杂度是o(1)

###3-exists key 时间复杂度o(1)
exists key    # 查看key是否存在
#设置a
set a b
#查看a是否存在
exists a
(integer) 1    # 返回结果
#存在返回1 不存在返回0

###4-del key  时间复杂度o(1)
删除成功返回1，key不存在返回0

###5-expire key seconds  时间复杂度o(1)
expire name 时间  # 给name这个key设置一个超时时间
expire name 3 #3s 过期
ttl name   # 还剩多长时间过期
persist name # 去掉超时时间，没有过期时间。如果过期了，就不存在了，返回(integer) 0

###6-type key  时间复杂度o(1)
type name # 查看key 对应数据的类型

# 2 数据结构：5大数据类型（字符串，列表，hash，集合，有序集合  他们底层有更丰富的类型存储）

# 3 单线程架构，同一时刻，只有一个命令（不会出现并发问题）
    -其实并不是真正的单线程，执行命令是单线程，可能会持久化数据

字符串类型

# 4 字符串类型
##常用命令
###1---基本使用get，set，del
get name       #时间复杂度 o(1)
set name lqz   #时间复杂度 o(1)
del name       #时间复杂度 o(1)
###2---其他使用incr,decr,incrby,decrby
incr age  #对age这个key的value值自增1
decr age  #对age这个key的value值自减1
incrby age 10  #对age这个key的value值增加10
decrby age 10  #对age这个key的value值减10
#统计网站访问量（单线程无竞争，天然适合做计数器）
#缓存mysql的信息（json格式）
#分布式id生成（多个机器同时并发着生成，不会重复）
###3---set，setnx，setxx
set name lqz  #不管key是否存在，都设置 
setnx name lqz #key不存在时才设置（新增操作）
set name lqz nx #同上
set name lqz xx #key存在，才设置（更新操作）
###4---mget mset
mget key1 key2 key3     #批量获取key1，key2.。。时间复杂度o(n)
mset key1 value1 key2 value2 key3 value3    #批量设置时间复杂度o(n)
#n次get和mget的区别
#n次get时间=n次命令时间+n次网络时间
#mget时间=1次网络时间+n次命令时间
###5---其他：getset，append，strlen
getset name lqznb #设置新值并返回旧值 时间复杂度o(1)
append name 666 #将value追加到旧的value 时间复杂度o(1)
strlen name  #计算字符串长度(注意中文)  时间复杂度o(1)
###6---其他：incrybyfloat,getrange,setrange
increbyfloat age 3.5  #为age自增3.5，传负值表示自减 时间复杂度o(1)
getrange key start end #获取字符串制定下标所有的值  时间复杂度o(1) 
#例 getrange name 1 3 取第1到第3位(从0开始)，前闭后闭区间
setrange key index value #从指定index开始设置value值  时间复杂度o(1)
#例 setrange name 1 ppp 从第1位开始替换为ppp  例如返回"lpppb666"

  -incrby   分布式id的生成
  -mget mset  批量设置值，取值 (生产环境中尽量少用)

分布式id的生成

哈希类型

哈希值结构

# 5 hash类型
##常用命令
###1---hget,hset,hdel
hget key field  #获取hash key对应的field的value 时间复杂度为 o(1)
hset key field value #设置hash key对应的field的value值 时间复杂度为 o(1)
hdel key field #删除hash key对应的field的值 时间复杂度为 o(1)
#测试
hset user:1:info age 23    #使用：分层方便层级查看
hget user:1:info age
hset user:1:info name lqz
hgetall user:1:info
hdel user:1:info age
###2---hexists,hlen
hexists key field  #判断hash key 是否存在field 时间复杂度为 o(1)
hlen key   #获取hash key field的数量  时间复杂度为 o(1)
hexists user:1:info name
hlen user:1:info  #返回数量
        
###3---hmget，hmset
hmget key field1 field2 ...fieldN  #批量获取hash key 的一批field对应的值  时间复杂度是o(n)
hmset key field1 value1 field2 value2  #批量设置hash key的一批field value 时间复杂度是o(n)

###4--hgetall,hvals，hkeys
hgetall key  #返回hash key 对应的所有field和value  时间复杂度是o(n)
hvals key   #返回hash key 对应的所有field的value  时间复杂度是o(n)
hkeys key   #返回hash key对应的所有field  时间复杂度是o(n)
###小心使用hgetall
##1 计算网站每个用户主页的访问量
hincrby user:1:info pageview count    #例hincrby user:1:info age 3
#这个key中user代表用户，1代表用户id，info代表用户信息。使用：分层方便软件查看   
#另外一般使用这种方法，好处是同一个key下。如果使用incrby key来自增，会导致key很多不方便，并影响效率
##2 缓存mysql的信息，直接设置hash格式(对比存string类型，key会少一些)

  hset
  hget
  hdel
  hexists
     --下方5个都是长慢命令
  hmget
  hmset 
  hgetall 获取所有    #长慢命令，出现卡顿情况。用hscan一点一点取，做生成器。hscan底层生成器实现
  hvals  获取所有value值
  hkeys 获取所有key值
  
  hincrby user:group  {    #此处伪代码，hincrby使用情况。 
    userid1:88
    userid2:100
    userid3:22
   }
 ####注意：哈希类型只支持一层，里面不能套字典，列表
    
 ##其他操作 hsetnx，hincrby，hincrbyfloat
 hestnx key field value #设置hash key对应field的value（如果field已存在，则失败），时间复杂度o(1)
 hincrby key field intCounter #hash key 对英的field的value自增intCounter 时间复杂度o(1)
 hincrbyfloat key field floatCounter #hincrby 浮点数 时间复杂度o(1)

# 面试官：你在使用redis的时候，有没有要注意的点？-----》拒绝长慢命令
# 在用redis的过程中遇到什么问题？-----》同事写的命令，慢，我去排查，修改hgeall---一次性获取出来用hscan代替，一点点取，做成生成器

列表类型

 # 6 列表类型
  -有序队列：从左侧添加，右侧添加，左侧弹出，右侧弹出，可以重复
  -实现队列和栈（爬虫深度优先和广度优先[先进先出还是后进后出]）
  
##插入操作
#rpush 从右侧插入
rpush key value1 value2 ...valueN  #时间复杂度为o(1~n)  例rpush ll 1 2 3
#lpush 从左侧插入
#linsert
linsert key before|after value newValue   #从元素value的前或后插入newValue 时间复杂度o(n) ，需要便利列表  例linsert ll before 2 888
linsert listkey before b java
linsert listkey after b php
##删除操作
lpop key #从列表左侧弹出一个item 时间复杂度o(1)
rpop key #从列表右侧弹出一个item 时间复杂度o(1)
  
  lrem #从指定位置删除
  lrem key count value
  #根据count值，从列表中删除所有value相同的项 时间复杂度o(n)
  1 count>0 从左到右，删除最多count个value相等的项
  2 count<0 从右向左，删除最多 Math.abs(count)个value相等的项
  3 count=0 删除所有value相等的项
  lrem listkey 0 a #删除列表中所有值a
  lrem listkey -1 c #从右侧删除1个c  

  ltrim key start end #按照索引范围修剪列表 o(n)  前后都为闭区间
  ltrim ll 1 4  #修剪，只保留下表1-4的元素
  
##查询操作
lrange key start end #包含end获取列表指定索引范围所有item  o(n)  end如果超出范围不报错
lrange listkey 0 2
lrange listkey 1 -1 #获取第一个位置到倒数第一个位置的元素

lindex key index #获取列表指定索引的item  o(n)
lindex listkey 0
lindex listkey -1    # 获取最后一个

llen key #获取列表长度

##修改操作
lset key index newValue #设置列表指定索引值为newValue o(n)
lset listkey 2 ppp #把第二个位置设为ppp
lset ll 1 99
#使用场景
  --时间轴：微信朋友圈状态，列表有顺序
  -关注的人  列表的key 你的id号[每次关注一个插入一条]
  
##其他操作
blpop key timeout #lpop的阻塞版，timeout是阻塞超时时间，timeout=0为拥有不阻塞 o(1)
brpop key timeout #rpop的阻塞版，timeout是阻塞超时时间，timeout=0为拥有不阻塞 o(1)

#要实现栈的功能
lpush+lpop        # 后进先出
#实现队列功能
lpush+rpop        # 先进先出
#固定大小的列表
lpush+ltrim        # 插进去修剪下
#消息队列
lpush+brpop        # 插入，右侧取的时候是阻塞状态   达到类似celery的效果
  
  # 队列用来干啥？
      -流量削峰    # 处理能力有限，一点点处理
    -解耦        # 本来一个程序，变为go项目给数据到python处理
    -异步

集合类型

 # 6 集合类型
    -无序，不重复（去重）,社交相关（交叉并补），同时关注刘亦菲的，你们公共关注的好友
  -你关注的人张三 喜欢了linux，python，
  -你喜欢了linux---》给你推荐python
  
  -推荐系统---》通过大数据分析的出来的---》
  -上海有个张三，年龄，性别，身高，职业。。。
  -跟北京的王五，，年龄，性别，身高，职业。。。都类似
  -忽然有一天张三在你们平台上买了绿色短裤（linux的课程）
  -可以推断出王五也可能喜欢绿色短裤，给王五推
  
 # 基本操作
  sadd key element #向集合key添加element（如果element存在，添加失败） o(1)
  srem key element #从集合中的element移除掉 o(1)
  scard key #计算集合大小
  sismember key element #判断element是否在集合中
  srandmember key count #从集合中随机取出count个元素，不会破坏集合中的元素
  srandmember key count 从集合中随机取出几个元素（抽奖），
  -汽车商场（抽奖功能），连续登陆14天---》获得抽奖资格---》7天后开奖---》送个头盔
    spop key    #从集合中随机弹出一个元素
  smembers key  获取集合中所有元素，无序 o(n) # 要小心，可能会阻塞
  sdiff user:1:follow user:2:follow  #计算user:1:follow和user:2:follow的差集
  sinter user:1:follow user:2:follow  #计算user:1:follow和user:2:follow的交集     
  sunion user:1:follow user:2:follow  #计算user:1:follow和user:2:follow的并集
  sdiff|sinter|suion + store destkey... #将差集，交集，并集结果保存在destkey集合中
  # sdiffstore newkey key1 key2 ...    # 把key1于key2的差集存入newkey中    
                
# 实战
抽奖系统 ：通过spop来弹出用户的id，活动取消，直接删除
点赞，点踩，喜欢等，用户如果点了赞，就把用户id放到该条记录的集合中  # 不会出现重复点的情况
标签：给用户/文章等添加标签，sadd user:1:tags 标签1 标签2 标签3    # 如果交集匹配超过30%就推荐
给标签添加用户，关注该标签的人有哪些
共同好友：集合间的操作

有序集合

# 7 有序集合
## 特点
#有一个分值字段，来保证顺序
key                  score                value
user:ranking           1                   lqz
user:ranking           99                  lqz2
user:ranking           88                  lqz3
#集合有序集合
集合：无重复元素，无序，element
有序集合：无重复元素，有序，element+score
#列表和有序集合
列表：可以重复，有序，element
有序集合：无重复元素，有序，element+score

### 基本操作
zadd key score element #score(必须有)可以重复,可以多个同时添加,element不能重复 o(logN) 
# zadd key grade1 member1 grade2 member2 ...
zrem key element #删除元素，可以多个同时删除 o(1)
zscore key element #获取元素的分数 o(1)
zincrby key increScore element #增加或减少元素的分数increScore  o(1) 
zcard key #返回元素总个数 o(1)
zrank key element #返回element元素所在的排名（从小到大排）
zrange key 0 -1 #返回排名，不带分数  o(log(n)+m) n是元素个数，m是要获取的值
#zrange zset1 0 1获取排名倒数第一与倒数第二 #zrange zset1 -2 -1 获取排名第二与第一
#zrange key start end    # 从低到高     #zrevrange key start end    # 从高到底
zrange player:rank 0 -1 withscores #返回排名，带分数
zrangebyscore key minScore maxScore #返回指定分数范围内的升序元素 o(log(n)+m) 
zrangebyscore user:1:ranking 90 210 withscores #获取90分到210分的元素
zcount key minScore maxScore #返回有序集合内在指定分数范围内的个数 o(log(n)+m)
zremrangebyrank key start end #删除指定排名内的升序元素 o(log(n)+m)
zremrangebyrank user:1:rangking 1 2 #删除升序排名中1到2的元素
zremrangebyscore key minScore maxScore #删除指定分数内的升序元素 o(log(n)+m)
zremrangebyscore user:1:ranking 90 210 #删除分数90到210之间的元素

文章阅读数 
zincrby key increScore element
zcard key
返回排名：过了一天了，管理员登陆到后台，统计一下上新的产品，浏览量（收藏量）排名
zrank key element

管理员统计浏览量在2w到3w之间的商品
zrangebyscore key minScore maxScore
  
 -实战：排行榜相关的操作
排行榜：音乐排行榜，销售榜，关注榜，游戏排行榜
 
### 其他操作
zrevrank #从高到低排序
zrevrange #从高到低排序取一定范围
zrevrangebyscore #返回指定分数范围内的降序元素
zinterstore #对两个有序集合交集
zunionstore #对两个有序集合求并集
  
# 面试官：你在使用redis的时候，有没有要注意的点？-----》拒绝长慢命令
# 在用redis的过程中遇到什么问题？-----》同事写的命令，慢，我去排查，修改hgeall---一次性获取出来    用hscan代替，一点点取，做成生成器

总结

操作类型	命令
基本操作	zadd/ zrem/ zcard/ zincrby/ zscore
范围操作	zrange/ zrangebyscore/ zcount/ zremrangebyrank
集合操作	zunionstore/ zinterstore

redis高级用法

慢查询

我们配置一个时间，如果查询时间超过了我们设置的时间，我们就认为这是一个慢查询.

慢查询发生在第三阶段

客户端超时不一定慢查询，但慢查询是客户端超时的一个可能因素

# 1 慢查询优化
一：修改配置问题
slowlog-max-len
# 固定长度        # 后面慢的命令会被丢弃
二：通过记录日志，后期分析日志，或者通过命令，定位出哪些命令慢，改掉它
# 慢查询阈值（单位：微秒） （1秒等于1000 000微秒）
slowlog-log-slower-than=0    # 超过设定微秒数的命令会被记录下来，如果=0记录所有命令
slowlog-log-slower-than <0,不记录任何命令

面试官问：在使用redis时有没有碰到什么问题？ 执行慢了---》通过分析日志，解决掉
celery使用碰到过什么问？redis大家都用---》有的同事写了一些慢命令导致redis阻塞了，导致我的celery项目
执行慢---》清空慢查询的队列

配置方法

1 默认配置

config get slowlog-max-len=128

Config get slowly-log-slower-than=10000

2 修改配置文件重启

3 动态配置

客户端的方式写入，一重启就失效了

# 设置记录所有命令
config set slowlog-log-slower-than 0
# 最多记录100条
config set slowlog-max-len 100
# 持久化到本地配置文件
config rewrite

'''
config set slowlog-max-len 1000
config set slowlog-log-slower-than 1000
'''

三个命令

通过命令查看慢查询日志，也可以直接通过日志文件查看

slowlog get [n]  #获取慢查询队列
'''
日志由4个属性组成：
1）日志的标识id
2）发生的时间戳
3）命令耗时
4）执行的命令和参数
'''

slowlog len #获取慢查询队列长度

slowlog reset #清空慢查询队列，速度就变快了

经验

1 slowlog-max-len 不要设置过大，默认10ms，通常设置1ms
2 slowlog-log-slower-than不要设置过小，通常设置1000左右
3 理解命令生命周期
4 定期持久化慢查询(也就是清理慢查询)

管道

-redis是不支持事务的（网上会说，redis支持事务）
-要么都成功要么都失败(断电后面就不执行了)---》mysql通过回滚实现的
-客户端的命令先放到管道中，---》一次性发送到服务端执行---》保证了要么都成功，要么都失败
### 客户端实现
import redis
pool = redis.ConnectionPool(host='10.211.55.4', port=6379)
r = redis.Redis(connection_pool=pool)
# pipe = r.pipeline(transaction=False)
#创建pipeline
pipe = r.pipeline(transaction=True)
#开启事务
pipe.multi()
pipe.set('name', 'lqz')
#其他代码，可能出异常
pipe.set('role', 'nb')

pipe.execute()    # 把上面的命令一起执行

### 与原生操作对比
通过pipeline提交的多次命令，在服务端执行的时候，可能会被拆成多次执行，而mget等操作，是一次性执行的，所以，pipeline执行的命令并非原子性的。
但是因为执行速度很快，基本一瞬间完成，除非极端情况(断电等)，可能出现有操作未完成

### 使用建议
1 注意每次pipeline携带的数据量
2 pipeline每次只能作用在一个Redis的节点上
3 M(mset，mget....)操作和pipeline的区别

# 使用场景
转账的人特别多。先把转账的人数据拿到redis中，张三减，李四加。然后做定时任务，把数据再同步到mysql中去

发布订阅

发布者发布了消息，所有的订阅者都可以收到，就是生产者消费者模型（后订阅了，无法获取历史消息）

模型

publish souhu:tv "hello world"  # 发布命令
subscribe souhu:tv   # 订阅频道
  
订阅之后，再在这个频道上发布消息，只要订阅了，都能收到

发布者订阅者

publish channel message #发布命令
publish souhu:tv "hello world" #在souhu:tv频道发布一条hello world  返回订阅者个数

subscribe [channel] #订阅命令，可以订阅一个或多个
subscribe souhu:tv  #订阅sohu:tv频道

unsubscribe [channel] #取消订阅一个或多个频道(需要在代码中进行使用,客户端连上无法退出)
unsubscribe sohu:tv  #取消订阅sohu:tv频道
    
psubscribe [pattern...] #订阅模式匹配  订阅多个频道
psubscribe c*  #订阅以c开头的频道

unpsubscribe [pattern...] #按模式退订指定频道

pubsub channels #列出至少有一个订阅者的频道,列出活跃的频道

pubsub numsub [channel...] #列出给定频道的订阅者数量

pubsub numpat #列出被订阅模式的数量

--发布订阅和消息队列的区别？
发布订阅数全收到，消息队列有个抢的过程，只有一个抢到

微信公众号订阅：公众号发了一篇文章，只要订阅了的，都可以收到更新。属于主动发送，不算这里说的发布订阅（发布订阅模式，观察者模式）
    -自己实现的，写了新文章，主动给所有订阅的用户推送
  
设计模式：单例模式，工厂模式；   观察者模式，代理模式（flask源码部分，request对象，用的是代理模式），迭代器模式

Bitmap位图（本质是字符串）

位图是什么

下面是字符串big对应的二进制（b是98）

# 4 bitmap 位图（字符串）
## 相关命令
set hello big #放入key位hello 值为big的字符串
getbit hello 0 #取位图的第0个位置，返回0
getbit hello 1 #取位图的第1个位置，返回1 如上图

##我们可以直接操纵位
setbit key offset value #给位图指定索引设置值
setbit hello 7 1 #把hello的第7个位置设为1 这样，big就变成了cig

setbit test 50 1 #test不存在，在key为test的value的第50位设为1，那其他位都以0补
# getbit test 1 #返回0  # getbit test 2 #返回0  # getbit test 50 #返回1 

bitcount key [start end] #获取位图指定范围(start到end,单位为字节,注意按字节一个字节8个bit为，如果不指定就是获取全部)位值为1的个数

bitop op destkey key [key...] #做多个Bitmap的and(交集)/or(并集)/not(非)/xor(异或)，操作并将结果保存在destkey中 
bitop and after_lqz lqz lqz2 #把lqz和lqz2按位与操作，放到after_lqz中

bitpos key targetBit start end #计算位图指定范围(start到end，单位为字节，如果不指定是获取全部)第一个偏移量对应的值等于targetBit的位置
bitpos lqz 1 #big 对应位图中第一个1的位置，在第二个位置上，由于从0开始返回1
bitpos lqz 0 #big 对应位图中第一个0的位置，在第一个位置上，由于从0开始返回0
bitpos lqz 1 1 2 #返回9：返回从第一个字节到第二个字节之间 第一个1的位置，看上图，为9

### 使用场景： 独立用户统计
1 使用set和Bitmap对比

2 1亿用户，5千万独立（1亿用户量，约5千万人访问，统计活跃用户数量）

数据类型	每个userid占用空间	需要存储用户量	全部内存量
set	32位(假设userid是整形，占32位)	5千万	32位*5千万=200MB
bitmap	1位	1亿	1位*1亿=12.5MB

假设有10万独立用户，使用位图还是占用12.5mb，使用set需要32位*1万=4MB

### 总结
1 位图类型是string类型，最大512M (1亿才12.5MB,绝对够了)
2 使用setbit时偏移量如果过大，会有较大消耗(setbit 1,2没问题。如果是1亿，10亿会有点慢)
3 位图不是绝对好用，需要合理使用
4 和布隆过滤器比较，因为布隆过滤器是经过运算取点，会比bitmap的方法更省空间

HyperLogLog（日活统计）几百人集合就行

基于HyperLogLog算法：极小的空间完成独立数量统计(比位图占的空间还要小)
本质还是字符串

## 三个命令
pfadd key element #向hyperloglog添加元素,可以同时添加多个
pfcount key #计算hyperloglog的独立总数
pfmerge destroy sourcekey1 sourcekey2#合并多个hyperloglog，把sourcekey1和sourcekey2合并为destroy

pfadd uuids "uuid1" "uuid2" "uuid3" "uuid4" #向uuids中添加4个uuid
pfcount uuids #返回4
pfadd uuids "uuid1" "uuid5"#有一个之前存在了，其实只把uuid5添加了，去重
pfcount uuids #返回5

pfadd uuids1 "uuid1" "uuid2" "uuid3" "uuid4"
pfadd uuids2 "uuid3" "uuid4" "uuid5" "uuid6"
pfmerge uuidsall uuids1 uuids2 #合并
pfcount uuidsall #统计个数 返回6

## 内存消耗&总结
百万级别独立用户统计，百万条数据只占15k
错误率 0.81%
无法取出单条数据，只能统计个数

  当时在做日活统计功能的时候，专门去调研了，想用HyperLogLog，发现没多少用户，直接用了集合，后期如果用户量增大，再用HyperLogLog    (日活几百人，用集合就可以了)
  
问题：日活5000左右，但是将阿里云的带宽200m全占满了，有什么解决方案
  收获：5000用户---》同时在访问你---》程序没有及时的响应回来（异步[尽量快速把请求处理完，mysql做主从]，cdn）
  服务降级，熔断，api网关

查看全文

相关阅读:
HashMap（HashSet）的实现
 C/C++ 安全编码 —— 指针与内存
 AlexNet神经网络结构
 查看，修改动态组成员/通讯组
 刷新已禁用用户邮箱状态
 监控DAG状态
 AD诊断命令
 PowerShell管理Exchange
TCP连接（Time_Wait、Close_Wait）说明
 IIS配置（安装IIS、.Net、更改IIS Log目录位置）

原文地址：https://www.cnblogs.com/ludingchao/p/14025687.html