sketch简述:
sketch是利用较小的空间资源,在高速网络环境中具有可靠精度实时储存流量特征信息的一种基于散列(Hash,一种将任意长度的消息压缩到某一固定长度的消息摘要的函数)的数据结构。
描述Count-min sketch的算法过程:
创建一个长度为 x 的数组,用来计数,初始化每个元素的计数值为 0;
对于一个新来的元素,哈希到 0 到 x 之间的一个数,比如哈希值为 i,作为数组的位置索引;
这是,数组对应的位置索引 i 的计数值加 1;
那么,这时要查询某个元素出现的频率,只要简单的返回这个元素哈希望后对应的数组的位置索引的计数值即可。
安装虚拟机
能力有限,止步于此。