概述
所谓bitmap就是用一个bit位来标记某个元素对应的value,而key即是这个元素。由于采用bit为单位来存储数据,因此在可以大大的节省存储空间。
算法思想
32位机器上,一个整形,比如int a;在内存中占32bit,可以用对应的32个bit位来表示十进制的0-31个数,bitmap算法利用这种思想处理大量数据的排序与查询。
优点:
- 效率高,不许进行比较和移位
- 占用内存少,比如N=10000000;只需占用内存为N/8 = 1250000Bytes = 1.2M,如果采用int数组存储,则需要38M多
缺点:
- 无法对存在重复的数据进行排序和查找
示例:申请一个int型的内存空间,则有4Byte,32bit。输入 4, 2, 1, 3时:
输入4:
输入2:
输入1:
输入3:
思想比较简单,关键是十进制和二进制bit位需要一个map映射表,把10进制映射到bit位上
map映射表
假设需要排序或者查找的总数N=10000000,那么我们需要申请的内存空间为 int a[N/32 + 1].其中a[0]在内存中占32位,依此类推。bitmap表为:
a[0] ------> 0 - 31
a[1] ------> 32 - 63
a[2] ------> 64 - 95
a[3] ------> 96 - 127
......
下面介绍用位移将十进制数转换为对应的bit位
位移转换
- 求十进制数0-N对应的在数组a中的下标:index_loc = N / 32即可,index_loc即为n对应的数组下标。例如n = 76, 则loc = 76 / 32 = 2,因此76在a[2]中。:
- 求十进制数0-N对应的bit位:bit_loc = N % 32即可,例如 n = 76, bit_loc = 76 % 32 = 12
- 利用移位0-31使得对应的32bit位为1
代码示例JAVA
![](https://images.cnblogs.com/OutliningIndicators/ContractedBlock.gif)
public class BitMap { private int[] arr; public BitMap(long maxNum) { long lenght=maxNum/32+1; arr=new int[(int) lenght]; for (int i = 0; i < arr.length; i++) { arr[i]=0;//初始化数组全为0 } } //改方法将n对应的bit位设为1 //参数n:将要处理的数据 //arr[]:int类型数字用于存储bit位 private static void set(int n,int[] arr){ int int_loc,bit_loc; int_loc=n>>5;//计算n对应bit在数组中的索引 bit_loc=n&0x1f;//计算n在arr[int_loc]对应的bit位 arr[int_loc]|=1<<bit_loc;//将n对应的bit为记为1; } private int testBit(int n,int[] arr){ int i; int result; i=1<<(n&0x0f); result=arr[n>>5]&i; return result; } public static void main(String[] args) { long maxNum=Long.MAX_VALUE; BitMap bitMap=new BitMap(maxNum); } }
附加:Java中的位运算
public static void main(String[] args) { // 1、左移( << ) //0000 0000 0000 0000 0000 0000 0000 0101 然后左移2位后,低位补0: //0000 0000 0000 0000 0000 0000 0001 0100 换算成10进制为20 System.out.println(5 << 2);// 运行结果是20 // 2、右移( >> ) 高位补符号位 // 0000 0000 0000 0000 0000 0000 0000 0101 然后右移2位,高位补0: // 0000 0000 0000 0000 0000 0000 0000 0001 System.out.println(5 >> 2);// 运行结果是1 //3、无符号右移( >>> ) 高位补0 //例如 -5换算成二进制后为:0101 取反加1为1011 //1111 1111 1111 1111 1111 1111 1111 1011 // 我们分别对5进行右移3位、 -5进行右移3位和无符号右移3位: System.out.println(5 >> 3);// 结果是0 System.out.println(-5 >> 3);// 结果是-1 System.out.println(-5 >>> 3);// 结果是536870911 //4、位与( &) //第一个操作数的的第n位于第二个操作数的第n位如果都是1,那么结果的第n为也为1,否则为0 System.out.println(5 & 3);// 结果为1 System.out.println(4 & 1);// 结果为0 //5、位或( | ) //第一个操作数的的第n位于第二个操作数的第n位只要有一个是1,那么结果的第n为也为1,否则为0 System.out.println(5 | 3);// 结果为7 // 6、位异或( ^ ) // 第一个操作数的的第n位于第二个操作数的第n位相反,那么结果的第n为也为1,否则为0 System.out.println(5 ^ 3);//结果为6 // 7、位非( ~ ) // 操作数的第n位为1,那么结果的第n位为0,反之。 System.out.println(~5);// 结果为-6 }