zoukankan      html  css  js  c++  java
  • 二分查找(java实现)

    什么是二分查找?

    二分查找(binary search)又叫折半查找,它是一种在有序数组中查找某一特定元素的搜索算法。

    二分查找必要条件?

    • 必须为顺序存储结构;
    • 必须按关键字大小有序排列。

    二分查找原理

    使用二分查找算法找出arrays数组中8的位置

    int[] arrays = new int[] {2,8,12,18,20,25,30,37,41,49,61};

    将有序数组分为三个部分,分别为中间值前(中间值数之前的一组数据),中间值和中间值后(中间值之后的一组数据);将要查找的数与中间值的数相比较,等于则退出查找,小于则在中间值前进行比较,大于在在中间值后进行比较,依次递归,直至查找到对应的值为止;当要查找数据结构为偶数时,中间值mid应向下取整处理;上述arrays数组中间值为{25},中间值前为{2,8,12,18,20},中间值后为{30,37,41,49,61}。二分查找计算原理图,如下:

    二分查找常用两种方式

    非递归

    public class BinarySearch {
        
        public static void main(String[] args) {
            Integer[] array = {5, 2, 10, 8, 7};
            //使用Arrays.sort对数组进行排序,默认为升序。如果要实现降序,可以使用Arrays.sort(array, Comparator)实现自定义的排序
            Arrays.sort(array);
            System.out.println(find(array, 7));
        }
        
        public static Boolean find(Integer[] array, Integer param) {
            int start = 0;
            int end = array.length - 1;
            int mid;
            
            while(start <= end) {
                //使用位运算是为了防止start+end溢出的情况
                mid = (start + end) >> 1;
                if(array[mid] == param) {
                    return true;
                }
                
                //注意start、end一定要取当前mid值的前一位或后一位,以免出现死循环,比如start为3,end为4,mid=(start+end)/2一直为3,出现死循环
                if(array[mid] < param) {
                    start = mid + 1;
                }else {
                    end = mid - 1;
                }
            }
            
            return false;
        }
    }

    递归

    public class Binarysearch {
        public static int rank(int key,int[] a)
        {
            return rank(key,a,0,a.length-1);
        }
         
        public static int rank(int key,int[] a,int lo, int hi)
        {
            if(lo>hi)//左边界下标比有边界下标大,则不符合条件,
                return -1;
            int mid = lo+(hi-lo)/2;
            if(key<a[mid])
                rank( key,a,lo,mid-1);
            else if(key>mid)
                rank(key,a,mid+1,hi);
            return mid;
        }
    }

    时间复杂度和空间复杂度

    时间复杂度:

    • 最坏的情况下两种方式时间复杂度一样:O(log2 N);
    • 最好情况下为O(1);

    空间复杂度:

    算法的空间复杂度并不是计算实际占用的空间,而是计算整个算法的辅助空间单元的个数

    • 非递归方式:由于辅助空间是常数级别的所以:空间复杂度是O(1);
    • 递归方式:递归的次数和深度都是log2 N,每次所需要的辅助空间都是常数级别的:空间复杂度:O(log2N )。

    二分查找中值(mid)计算 二分查找中值计算有两种方式:

    int mid = (low + high) / 2;
    int mid = low + (high - low) / 2;

    上述两种算法看似第一种要简洁,第二种提取之后,跟第一种没有什么区别。但是实际上上述两种计算是有区别的,第一种的做法是在极端情况下计算的,(low + high)存在着溢出的风险,进而有可能得到错误的mid结果,导致程序错误;而第二种算法能够保证计算出来的mid值一定大于low、小于high,不存在溢出的问题。 针对第一种算法为了防止溢出问题,可以使用:int mid = (high + low) >>> 1; 解决此问题。

    二分查找的优缺点:

    • 优点:比较次数少,查找速度快,平均性能好。
    • 缺点:必须有序,必须是数组。

    引申

    解决二分查找缺陷问题更好的方法是使用二叉查找树,最好自然是自平衡二叉查找树,既能高效的(O(n log n))构建有序元素集合,又能如同二分查找法一样快速(O(log n))的搜寻目标数。

    问题

    以上的二分查找解决不了如下几个问题:

    变体一:查找第一个值等于给定值的元素

    比如下面这样一个有序数组,其中,a[5],a[6],a[7] 的值都等于 8,是重复的数据。我们希望查找第一个等于 8 的数据,也就是下标是 5 的元素。

    首先拿 8 与区间的中间值 a[4] 比较,8 比6 大,于是在下标 5 到 9 之间继续查找。下标 5 和 9 的中间位置是下标 7,a[7] 正好等于8,所以代码就返回了。尽管 a[7] 也等于 8,但它并不是我们想要找的第一个等于 8 的元素,因为第一个值等于 8的元素是数组下标为 5 的元素。
    public class BinarySearch {
    
        public static void main(String[] args) {
            int[] array = { 5, 2, 10, 8, 7 };
            // 使用Arrays.sort对数组进行排序,默认为升序。如果要实现降序,可以使用Arrays.sort(array, Comparator)实现自定义的排序
            Arrays.sort(array);
            System.out.println(find(array, 10));
        }
    
        public static int find(int[] a, int value) {
            int low = 0;
            int high = a.length - 1;
            //注意终止条件为low>high,因为low==high的这个元素有可能就是需要被查找的。
            while (low <= high) {
                //这种写法主要为了防止(low+high)/2超过int的上限值
                int mid = low + ((high - low) >> 1);
                //如果a[mid]>value,说明只能存在于[low~mid-1]
                if (a[mid] > value) {
                    high = mid - 1;
                //同理若a[mid]<value,说明只能存在于[mid+1~high]
                } else if (a[mid] < value) {
                    low = mid + 1;
                //这时候a[mid]==value,但是不一定是第一个等于value的
                } else {
                    //如果第一个元素等于value,很明显,那就返回第一个元素的地址。如果mid的前一个元素不等于value,直接返回,否则继续往前找
                    if ((mid == 0) || (a[mid - 1] != value)) {
                        return mid;
                    }else {
                        //否则low不变,high往前移动一位,继续寻找
                        high = mid - 1;
                    }
                }
            }
            return -1;
        }
    }

    变体二:查找最后一个值等于给定值的元素

    public class BinarySearch {
    
        public static void main(String[] args) {
            int[] array = { 5, 2, 10, 8, 7, 10 };
            // 使用Arrays.sort对数组进行排序,默认为升序。如果要实现降序,可以使用Arrays.sort(array, Comparator)实现自定义的排序
            Arrays.sort(array);
            System.out.println(find(array, 10));
        }
    
        public static int find(int[] a, int value) {
            int low = 0;
            int high = a.length - 1;
            //注意终止条件为low>high,因为low==high的这个元素有可能就是需要被查找的。
            while (low <= high) {
                //这种写法主要为了防止(low+high)/2超过int的上限值
                int mid = low + ((high - low) >> 1);
                //如果a[mid]>value,说明只能存在于[low~mid-1]
                if (a[mid] > value) {
                    high = mid - 1;
                //同理若a[mid]<value,说明只能存在于[mid+1~high]
                } else if (a[mid] < value) {
                    low = mid + 1;
                //这时候a[mid]==value,但是不一定是第一个等于value的
                } else {
                    //如果最后一个元素等于value,很明显,那就返回最后一个元素的地址。如果mid的后一个元素不等于value,直接返回,否则继续往后找
                    if ((mid == a.length - 1) || (a[mid + 1] != value)) {
                        return mid;
                    }else {
                        //否则high不变,low往前移动一位,继续寻找
                        low = mid + 1;
                    }
                }
            }
            return -1;
        }
    }

    变体三:查找第一个大于等于给定值的元素

    在有序数组中,查找第一个大于等于给定值的元素。比如,数组中存储的这样一个序列:3,4,6,7,10。如果查找第一个大于等于 5 的元素,那就是 6。
    public class BinarySearch {
    
        public static void main(String[] args) {
            int[] array = { 5, 2, 10, 8, 7, 10 };
            // 使用Arrays.sort对数组进行排序,默认为升序。如果要实现降序,可以使用Arrays.sort(array, Comparator)实现自定义的排序
            Arrays.sort(array);
            System.out.println(find(array, 6));
        }
    
        public static int find(int[] a, int value) {
            int low = 0;
            int high = a.length - 1;
            while (low <= high) {
                int mid = low + ((high - low) >> 1);
                if (a[mid] >= value) {
                    //第一个元素就比目标值大,那结果就是第一个元素。或者mid的前一个元素小于value,那此时mid就是那个元素
                    if (mid == 0 || a[mid - 1] < value) {
                        return mid;
                    }else {
                        //否则将high往前移动一位,继续寻找
                        high = mid - 1;
                    }
                } else {
                    //如果a[mid]<value,那么元素只可能存在于[mid+1, high]
                    low = mid + 1;
                }
            }
            return -1;
        }
    }

    变体四:查找最后一个小于等于给定值的元素

    查找最后一个小于等于给定值的元素。比如,数组中存储了这样一组数据:3,5,6,8,9,10。最后一个小于等于 7 的元素就是6。
     
    public class BinarySearch {
    
        public static void main(String[] args) {
            int[] array = { 5, 2, 10, 8, 7, 10 };
            // 使用Arrays.sort对数组进行排序,默认为升序。如果要实现降序,可以使用Arrays.sort(array, Comparator)实现自定义的排序
            Arrays.sort(array);
            System.out.println(find(array, 6));
        }
    
        public static int find(int[] a, int value) {
            int low = 0;
            int high = a.length - 1;
            while (low <= high) {
                int mid = low + ((high - low) >> 1);
                if (a[mid] > value) {
                    // 将high往前移动一位,继续寻找
                    high = mid - 1;
                } else {
                    //如果mid是最后一个元素,肯定就是他了。或者mid后面那个元素大于value,此时返回mid
                    if ((mid == a.length - 1) || (a[mid + 1] > value)) {
                        return mid;
                    } else {
                        //否则low继续后移
                        low = mid + 1;
                    }
                }
            }
            return -1;
        }
    }
    注:其实二分查找的重点就是在一轮没有查找到结果后,low以及high的值如何改变的问题
     
  • 相关阅读:
    大数据技术之Kafka是什么
    大数据技术之Hadoop 基础认识
    在eclipse中运行Mapreduce & spark
    datatstage 中一直处于Ready 状态
    Datastage run 有时候太慢 有时候performance 还Okay
    不能重复造轮子,尤其是枯燥的轮子,要造就造有趣的、好玩的轮子
    什么是好?什么是优秀?
    字面量-上集
    图片切换-vue
    数据绑定
  • 原文地址:https://www.cnblogs.com/alimayun/p/12523700.html
Copyright © 2011-2022 走看看