zoukankan      html  css  js  c++  java
  • BitMap算法 .net实现 用于去重并且排序,适用于大型权限管理 ,大数据去重排序

    BitMap利用byte特性 针对排序+去重  最佳实践: 100万条数据的排序+去重用时200毫秒左右

      static void Main(string[] args)
            {
                int[] data = new int[10000000];
                /*alias*/
                Random r = new Random();
                for (int i = 0; i < data.Length; i++)
                {
                    data[i] = r.Next(1, 10000000);
                }
                Stopwatch stop = new Stopwatch();
                stop.Start();
                List<byte> lstbyte = new List<byte>();
                foreach (var item in data)
                {
                    int unit = item / 8;
                    int index = item % 8;
                    if (lstbyte.Count <= unit)
                    {
                        lstbyte.AddRange(new byte[unit-lstbyte.Count + 1]);
                    }
                    lstbyte[unit] = set_bit(lstbyte[unit], index + 1, true);
                }
                List<int> result = new List<int>();
                for (int i = 0; i < lstbyte.Count; i++)
                {
                    int currentIndex = i*8;
                    List<int> lstint = new List<int>();
                    if (lstbyte[i] > 0)
                    {
                        /**
                         * 这段代码用于判断,byte对应位置的值是否有1
                         * 例如: 目标 byte:0010 0001 
                         *  0010 0001 & 0000 0001 结果为1则 第一位为1
                         *  第二位比较方式就是目标byte和 0010 0001 & 0000 0010
                         *  为避免频繁的装箱拆箱操作,这里不用通过 Math.Pow计算平2的平方立方来得到目标比较数。
                         */
                        int b = lstbyte[i] & 0x01;
                        if (b  == 1)
                        {
                            lstint.Add(currentIndex+0);
                        }
                        b = lstbyte[i] & 0x02;
                        if (b == 2)
                        {
                            lstint.Add(currentIndex + 1);
                        }
                        b = lstbyte[i] & 0x04;
                        if (b == 4)
                        {
                            lstint.Add(currentIndex + 2);
                        }
                        b = lstbyte[i] & 0x08;
                        if (b == 8)
                        {
                            lstint.Add(currentIndex + 3);
                        }
                        b = lstbyte[i] & 0x10;
                        if (b == 16)
                        {
                            lstint.Add(currentIndex + 4);
                        }
                        b = lstbyte[i] & 0x20;
                        if (b == 32)
                        {
                            lstint.Add(currentIndex + 5);
                        }
                        b = lstbyte[i] & 0x40;
                        if (b == 64)
                        {
                            lstint.Add(currentIndex + 6);
                        }
                        b = lstbyte[i] & 0x80;
                        if (b == 128)
                        {
                            lstint.Add(currentIndex + 7);
                        }
                    }
                    result.AddRange(lstint);
                }
                stop.Stop();
                Console.WriteLine("结果数:"+result.Count);
                //foreach (var item in result)
                //{
                //    Console.WriteLine(item);
                //}
                Console.WriteLine(string.Concat("时间:" ,stop.ElapsedMilliseconds ,"毫秒"));
                Console.ReadKey();
            }
            /// <summary>
            /// 设置某一位的值
            /// </summary>
            /// <param name="data"></param>
            /// <param name="index">要设置的位, 值从低到高为 1-8</param>
            /// <param name="flag">要设置的值 true / false</param>
            /// <returns></returns>
            static byte set_bit(byte data, int index, bool flag)
            {
                if (index > 8 || index < 1)
                    throw new ArgumentOutOfRangeException();
                int v = index < 2 ? index : (2 << (index - 2));
                return flag ? (byte)(data | v) : (byte)(data & ~v);
            }
    View Code

    运行速度和待排序去重的最大数的大小有关系

  • 相关阅读:
    String空格删除和java删除字符串最后一个字符的几种方法
    Ceph 12.2.0 实践osd 智能分组功能
    Ceph 12.2.0 实践osd 智能分组功能
    Ceph 12.2.0 实践osd 智能分组功能
    Ceph 12.2.0 实践osd 智能分组功能
    取区域/扇区边界点
    取区域/扇区边界点
    取区域/扇区边界点
    取区域/扇区边界点
    解决客户端向服务器数据库传输中文乱码的方法
  • 原文地址:https://www.cnblogs.com/zzfstudy/p/7416919.html
Copyright © 2011-2022 走看看