zoukankan      html  css  js  c++  java
  • BitMap

    概述

      所谓bitmap就是用一个bit位来标记某个元素对应的value,而key即是这个元素。由于采用bit为单位来存储数据,因此在可以大大的节省存储空间。

    算法思想

      32位机器上,一个整形,比如int a;在内存中占32bit,可以用对应的32个bit位来表示十进制的0-31个数,bitmap算法利用这种思想处理大量数据的排序与查询。
    优点:
    • 效率高,不许进行比较和移位
    • 占用内存少,比如N=10000000;只需占用内存为N/8 = 1250000Bytes = 1.2M,如果采用int数组存储,则需要38M多
    缺点:
    • 无法对存在重复的数据进行排序和查找
      示例:申请一个int型的内存空间,则有4Byte,32bit。输入 4, 2,  1,  3时:
      输入4:

      输入2:

      输入1:

      输入3:

      思想比较简单,关键是十进制和二进制bit位需要一个map映射表,把10进制映射到bit位上

    map映射表

      假设需要排序或者查找的总数N=10000000,那么我们需要申请的内存空间为 int a[N/32 + 1].其中a[0]在内存中占32位,依此类推。bitmap表为:
        a[0] ------> 0 - 31
        a[1] ------> 32 - 63
        a[2] ------> 64 - 95
        a[3] ------> 96 - 127
        ......
      下面介绍用位移将十进制数转换为对应的bit位

    位移转换

    1.   求十进制数0-N对应的在数组a中的下标:index_loc = N / 32即可,index_loc即为n对应的数组下标。例如n = 76, 则loc = 76 / 32 = 2,因此76在a[2]中。:
    2. 求十进制数0-N对应的bit位:bit_loc = N % 32即可,例如 n = 76, bit_loc = 76 % 32 = 12
    3. 利用移位0-31使得对应的32bit位为1

    代码示例JAVA

    public class BitMap {
        private int[] arr;
        public BitMap(long maxNum) {
            long lenght=maxNum/32+1;
            arr=new int[(int) lenght];
            for (int i = 0; i < arr.length; i++) {
                arr[i]=0;//初始化数组全为0
            }
        }
    
        //改方法将n对应的bit位设为1
        //参数n:将要处理的数据
        //arr[]:int类型数字用于存储bit位
        private static void set(int n,int[] arr){
            int int_loc,bit_loc;
            int_loc=n>>5;//计算n对应bit在数组中的索引
            bit_loc=n&0x1f;//计算n在arr[int_loc]对应的bit位
            arr[int_loc]|=1<<bit_loc;//将n对应的bit为记为1;
        }
        
        private int testBit(int n,int[] arr){
            int i;
            int result;
            i=1<<(n&0x0f);
            result=arr[n>>5]&i;
            return result;
        }
    
        public static void main(String[] args) {
            long maxNum=Long.MAX_VALUE;
            BitMap bitMap=new BitMap(maxNum);
        }
    }
    View Code

    附加:Java中的位运算

    public static void main(String[] args) {
    	// 1、左移( << ) 
    	//0000 0000 0000 0000 0000 0000 0000 0101 然后左移2位后,低位补0:
    	//0000 0000 0000 0000 0000 0000 0001 0100 换算成10进制为20
    	System.out.println(5 << 2);// 运行结果是20
    
    	// 2、右移( >> ) 高位补符号位
    	// 0000 0000 0000 0000 0000 0000 0000 0101 然后右移2位,高位补0:
    	// 0000 0000 0000 0000 0000 0000 0000 0001
    	System.out.println(5 >> 2);// 运行结果是1
    
    	//3、无符号右移( >>> ) 高位补0
    	//例如 -5换算成二进制后为:0101 取反加1为1011
    	//1111 1111 1111 1111 1111 1111 1111 1011
    	// 我们分别对5进行右移3位、 -5进行右移3位和无符号右移3位:
    	System.out.println(5 >> 3);// 结果是0
    	System.out.println(-5 >> 3);// 结果是-1
    	System.out.println(-5 >>> 3);// 结果是536870911
    
    	//4、位与( &) 
    	//第一个操作数的的第n位于第二个操作数的第n位如果都是1,那么结果的第n为也为1,否则为0
    	System.out.println(5 & 3);// 结果为1
    	System.out.println(4 & 1);// 结果为0
    
    	//5、位或( | )
    	//第一个操作数的的第n位于第二个操作数的第n位只要有一个是1,那么结果的第n为也为1,否则为0
    	System.out.println(5 | 3);// 结果为7
    
    	// 6、位异或( ^ )
    	// 第一个操作数的的第n位于第二个操作数的第n位相反,那么结果的第n为也为1,否则为0
    	System.out.println(5 ^ 3);//结果为6 
    
    	// 7、位非( ~ )
    	// 操作数的第n位为1,那么结果的第n位为0,反之。
    	System.out.println(~5);// 结果为-6 
    } 
    
  • 相关阅读:
    中小企业服务器配置方案(第三章 Web服务器)
    判断中日韩文的正则表达式
    中小企业服务器配置方案(第一章 代理接入服务器)
    ThinkPHP怎么样更好的使用Smarty第三方插件
    thinkphp 的目录结构
    学习Mysql命令行
    中小企业服务器配置方案(第五章 文件服务器)
    正则字符对应说明
    mysql导入导出.sql文件备份还原数据库[mysql导入导出sql命令行]
    中小企业服务器配置方案(第四章 邮件服务器)
  • 原文地址:https://www.cnblogs.com/wxgblogs/p/5712569.html
Copyright © 2011-2022 走看看