zoukankan      html  css  js  c++  java
  • JavaScript 数据结构与算法之美

    JavaScript 数据结构与算法之美

    全栈修炼

    1. 前言

    算法为王。

    想学好前端,先练好内功,只有内功深厚者,前端之路才会走得更远

    笔者写的 JavaScript 数据结构与算法之美 系列用的语言是 JavaScript ,旨在入门数据结构与算法和方便以后复习。

    之所以把冒泡排序、选择排序、插入排序放在一起比较,是因为它们的平均时间复杂度都为 O(n2)。

    请大家带着问题:为什么插入排序比冒泡排序更受欢迎 ?来阅读下文。

    2. 如何分析一个排序算法

    复杂度分析是整个算法学习的精髓。

    • 时间复杂度: 一个算法执行所耗费的时间。
    • 空间复杂度: 运行完一个程序所需内存的大小。

    时间和空间复杂度的详解,请看 JavaScript 数据结构与算法之美 - 时间和空间复杂度

    学习排序算法,我们除了学习它的算法原理、代码实现之外,更重要的是要学会如何评价、分析一个排序算法。

    分析一个排序算法,要从 执行效率内存消耗稳定性 三方面入手。

    2.1 执行效率

    1. 最好情况、最坏情况、平均情况时间复杂度

    我们在分析排序算法的时间复杂度时,要分别给出最好情况、最坏情况、平均情况下的时间复杂度。
    除此之外,你还要说出最好、最坏时间复杂度对应的要排序的原始数据是什么样的。

    2. 时间复杂度的系数、常数 、低阶

    我们知道,时间复杂度反应的是数据规模 n 很大的时候的一个增长趋势,所以它表示的时候会忽略系数、常数、低阶。

    但是实际的软件开发中,我们排序的可能是 10 个、100 个、1000 个这样规模很小的数据,所以,在对同一阶时间复杂度的排序算法性能对比的时候,我们就要把系数、常数、低阶也考虑进来。

    3. 比较次数和交换(或移动)次数

    这一节和下一节讲的都是基于比较的排序算法。基于比较的排序算法的执行过程,会涉及两种操作,一种是元素比较大小,另一种是元素交换或移动。

    所以,如果我们在分析排序算法的执行效率的时候,应该把比较次数和交换(或移动)次数也考虑进去。

    2.2 内存消耗

    也就是看空间复杂度。

    还需要知道如下术语:

    • 内排序:所有排序操作都在内存中完成;
    • 外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;
    • 原地排序:原地排序算法,就是特指空间复杂度是 O(1) 的排序算法。
      其中,冒泡排序就是原地排序算法。

    2.3 稳定性

    • 稳定:如果待排序的序列中存在值相等的元素,经过排序之后,相等元素之间原有的先后顺序不变
      比如: a 原本在 b 前面,而 a = b,排序之后,a 仍然在 b 的前面;
    • 不稳定:如果待排序的序列中存在值相等的元素,经过排序之后,相等元素之间原有的先后顺序改变
      比如:a 原本在 b 的前面,而 a = b,排序之后, a 在 b 的后面;

    3. 冒泡排序

    冒泡

    思想

    • 冒泡排序只会操作相邻的两个数据。
    • 每次冒泡操作都会对相邻的两个元素进行比较,看是否满足大小关系要求。如果不满足就让它俩互换。
    • 一次冒泡会让至少一个元素移动到它应该在的位置,重复 n 次,就完成了 n 个数据的排序工作。

    特点

    • 优点:排序算法的基础,简单实用易于理解。
    • 缺点:比较次数多,效率较低。

    实现

    // 冒泡排序(未优化)
    const bubbleSort = arr => {
    	console.time('改进前冒泡排序耗时');
    	const length = arr.length;
    	if (length <= 1) return;
    	// i < length - 1 是因为外层只需要 length-1 次就排好了,第 length 次比较是多余的。
    	for (let i = 0; i < length - 1; i++) {
    		// j < length - i - 1 是因为内层的 length-i-1 到 length-1 的位置已经排好了,不需要再比较一次。
    		for (let j = 0; j < length - i - 1; j++) {
    			if (arr[j] > arr[j + 1]) {
    				const temp = arr[j];
    				arr[j] = arr[j + 1];
    				arr[j + 1] = temp;
    			}
    		}
    	}
    	console.log('改进前 arr :', arr);
    	console.timeEnd('改进前冒泡排序耗时');
    };
    

    优化:当某次冒泡操作已经没有数据交换时,说明已经达到完全有序,不用再继续执行后续的冒泡操作。

    // 冒泡排序(已优化)
    const bubbleSort2 = arr => {
    	console.time('改进后冒泡排序耗时');
    	const length = arr.length;
    	if (length <= 1) return;
    	// i < length - 1 是因为外层只需要 length-1 次就排好了,第 length 次比较是多余的。
    	for (let i = 0; i < length - 1; i++) {
    		let hasChange = false; // 提前退出冒泡循环的标志位
    		// j < length - i - 1 是因为内层的 length-i-1 到 length-1 的位置已经排好了,不需要再比较一次。
    		for (let j = 0; j < length - i - 1; j++) {
    			if (arr[j] > arr[j + 1]) {
    				const temp = arr[j];
    				arr[j] = arr[j + 1];
    				arr[j + 1] = temp;
    				hasChange = true; // 表示有数据交换
    			}
    		}
    
    		if (!hasChange) break; // 如果 false 说明所有元素已经到位,没有数据交换,提前退出
    	}
    	console.log('改进后 arr :', arr);
    	console.timeEnd('改进后冒泡排序耗时');
    };
    

    测试

    // 测试
    const arr = [7, 8, 4, 5, 6, 3, 2, 1];
    bubbleSort(arr);
    // 改进前 arr : [1, 2, 3, 4, 5, 6, 7, 8]
    // 改进前冒泡排序耗时: 0.43798828125ms
    
    const arr2 = [7, 8, 4, 5, 6, 3, 2, 1];
    bubbleSort2(arr2);
    // 改进后 arr : [1, 2, 3, 4, 5, 6, 7, 8]
    // 改进后冒泡排序耗时: 0.318115234375ms
    

    分析

    • 第一,冒泡排序是原地排序算法吗 ?
      冒泡的过程只涉及相邻数据的交换操作,只需要常量级的临时空间,所以它的空间复杂度为 O(1),是一个原地排序算法。
    • 第二,冒泡排序是稳定的排序算法吗 ?
      在冒泡排序中,只有交换才可以改变两个元素的前后顺序。
      为了保证冒泡排序算法的稳定性,当有相邻的两个元素大小相等的时候,我们不做交换,相同大小的数据在排序前后不会改变顺序。
      所以冒泡排序是稳定的排序算法。
    • 第三,冒泡排序的时间复杂度是多少 ?
      最佳情况:T(n) = O(n),当数据已经是正序时。
      最差情况:T(n) = O(n2),当数据是反序时。
      平均情况:T(n) = O(n2)。

    动画

    冒泡排序动画

    冒泡排序动画

    4. 插入排序

    插入排序又为分为 直接插入排序 和优化后的 拆半插入排序希尔排序,我们通常说的插入排序是指直接插入排序。

    一、直接插入

    思想

    一般人打扑克牌,整理牌的时候,都是按牌的大小(从小到大或者从大到小)整理牌的,那每摸一张新牌,就扫描自己的牌,把新牌插入到相应的位置。

    插入排序的工作原理:通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

    步骤

    • 从第一个元素开始,该元素可以认为已经被排序;
    • 取出下一个元素,在已经排序的元素序列中从后向前扫描;
    • 如果该元素(已排序)大于新元素,将该元素移到下一位置;
    • 重复步骤 3,直到找到已排序的元素小于或者等于新元素的位置;
    • 将新元素插入到该位置后;
    • 重复步骤 2~5。

    实现

    // 插入排序
    const insertionSort = array => {
    	const len = array.length;
    	if (len <= 1) return
    
    	let preIndex, current;
    	for (let i = 1; i < len; i++) {
    		preIndex = i - 1; //待比较元素的下标
    		current = array[i]; //当前元素
    		while (preIndex >= 0 && array[preIndex] > current) {
    			//前置条件之一: 待比较元素比当前元素大
    			array[preIndex + 1] = array[preIndex]; //将待比较元素后移一位
    			preIndex--; //游标前移一位
    		}
    		if (preIndex + 1 != i) {
    			//避免同一个元素赋值给自身
    			array[preIndex + 1] = current; //将当前元素插入预留空位
    			console.log('array :', array);
    		}
    	}
    	return array;
    };
    

    测试

    // 测试
    const array = [5, 4, 3, 2, 1];
    console.log("原始 array :", array);
    insertionSort(array);
    // 原始 array:    [5, 4, 3, 2, 1]
    // array:  		 [4, 5, 3, 2, 1]
    // array:  		 [3, 4, 5, 2, 1]
    // array: 		 [2, 3, 4, 5, 1]
    // array:  		 [1, 2, 3, 4, 5]
    

    分析

    • 第一,插入排序是原地排序算法吗 ?
      插入排序算法的运行并不需要额外的存储空间,所以空间复杂度是 O(1),所以,这是一个原地排序算法。
    • 第二,插入排序是稳定的排序算法吗 ?
      在插入排序中,对于值相同的元素,我们可以选择将后面出现的元素,插入到前面出现元素的后面,这样就可以保持原有的前后顺序不变,所以插入排序是稳定的排序算法。
    • 第三,插入排序的时间复杂度是多少 ?
      最佳情况:T(n) = O(n),当数据已经是正序时。
      最差情况:T(n) = O(n2),当数据是反序时。
      平均情况:T(n) = O(n2)。

    动画

    insertion-sort.gif

    二、拆半插入

    插入排序也有一种优化算法,叫做拆半插入

    思想

    折半插入排序是直接插入排序的升级版,鉴于插入排序第一部分为已排好序的数组, 我们不必按顺序依次寻找插入点, 只需比较它们的中间值与待插入元素的大小即可。

    步骤

    • 取 0 ~ i-1 的中间点 ( m = (i-1)>>1 ),array[i] 与 array[m] 进行比较,若 array[i] < array[m],则说明待插入的元素 array[i] 应该处于数组的 0 ~ m 索引之间;反之,则说明它应该处于数组的 m ~ i-1 索引之间。
    • 重复步骤 1,每次缩小一半的查找范围,直至找到插入的位置。
    • 将数组中插入位置之后的元素全部后移一位。
    • 在指定位置插入第 i 个元素。

    注:x>>1 是位运算中的右移运算,表示右移一位,等同于 x 除以 2 再取整,即 x>>1 == Math.floor(x/2) 。

    // 折半插入排序
    const binaryInsertionSort = array => {
    	const len = array.length;
    	if (len <= 1) return;
    
    	let current, i, j, low, high, m;
    	for (i = 1; i < len; i++) {
    		low = 0;
    		high = i - 1;
    		current = array[i];
    
    		while (low <= high) {
    			//步骤 1 & 2 : 折半查找
    			m = (low + high) >> 1; // 注: x>>1 是位运算中的右移运算, 表示右移一位, 等同于 x 除以 2 再取整, 即 x>>1 == Math.floor(x/2) .
    			if (array[i] >= array[m]) {
    				//值相同时, 切换到高半区,保证稳定性
    				low = m + 1; //插入点在高半区
    			} else {
    				high = m - 1; //插入点在低半区
    			}
    		}
    		for (j = i; j > low; j--) {
    			//步骤 3: 插入位置之后的元素全部后移一位
    			array[j] = array[j - 1];
    			console.log('array2 :', JSON.parse(JSON.stringify(array)));
    		}
    		array[low] = current; //步骤 4: 插入该元素
    	}
    	console.log('array2 :', JSON.parse(JSON.stringify(array)));
    	return array;
    };
    

    测试

    const array2 = [5, 4, 3, 2, 1];
    console.log('原始 array2:', array2);
    binaryInsertionSort(array2);
    // 原始 array2:  [5, 4, 3, 2, 1]
    // array2 :     [5, 5, 3, 2, 1]
    // array2 :     [4, 5, 5, 2, 1]
    // array2 :     [4, 4, 5, 2, 1]
    // array2 :     [3, 4, 5, 5, 1]
    // array2 :     [3, 4, 4, 5, 1]
    // array2 :     [3, 3, 4, 5, 1]
    // array2 :     [2, 3, 4, 5, 5]
    // array2 :     [2, 3, 4, 4, 5]
    // array2 :     [2, 3, 3, 4, 5]
    // array2 :     [2, 2, 3, 4, 5]
    // array2 :     [1, 2, 3, 4, 5]
    

    注意:和直接插入排序类似,折半插入排序每次交换的是相邻的且值为不同的元素,它并不会改变值相同的元素之间的顺序,因此它是稳定的。

    三、希尔排序

    希尔排序是一个平均时间复杂度为 O(nlogn) 的算法,会在下一个章节和 归并排序、快速排序、堆排序 一起讲,本文就不展开了。

    5. 选择排序

    思路

    选择排序算法的实现思路有点类似插入排序,也分已排序区间和未排序区间。但是选择排序每次会从未排序区间中找到最小的元素,将其放到已排序区间的末尾。

    步骤

    1. 首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置。
    2. 再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。
    3. 重复第二步,直到所有元素均排序完毕。

    实现

    const selectionSort = array => {
    	const len = array.length;
    	let minIndex, temp;
    	for (let i = 0; i < len - 1; i++) {
    		minIndex = i;
    		for (let j = i + 1; j < len; j++) {
    			if (array[j] < array[minIndex]) {
    				// 寻找最小的数
    				minIndex = j; // 将最小数的索引保存
    			}
    		}
    		temp = array[i];
    		array[i] = array[minIndex];
    		array[minIndex] = temp;
    		console.log('array: ', array);
    	}
    	return array;
    };
    

    测试

    // 测试
    const array = [5, 4, 3, 2, 1];
    console.log('原始array:', array);
    selectionSort(array);
    // 原始 array:  [5, 4, 3, 2, 1]
    // array:  		 [1, 4, 3, 2, 5]
    // array:  		 [1, 2, 3, 4, 5]
    // array: 		 [1, 2, 3, 4, 5]
    // array:  		 [1, 2, 3, 4, 5]
    

    分析

    • 第一,选择排序是原地排序算法吗 ?
      选择排序空间复杂度为 O(1),是一种原地排序算法。
    • 第二,选择排序是稳定的排序算法吗 ?
      选择排序每次都要找剩余未排序元素中的最小值,并和前面的元素交换位置,这样破坏了稳定性。所以,选择排序是一种不稳定的排序算法。
    • 第三,选择排序的时间复杂度是多少 ?
      无论是正序还是逆序,选择排序都会遍历 n2 / 2 次来排序,所以,最佳、最差和平均的复杂度是一样的。
      最佳情况:T(n) = O(n2)。
      最差情况:T(n) = O(n2)。
      平均情况:T(n) = O(n2)。

    动画

    selection-sort.gif

    6. 解答开篇

    为什么插入排序比冒泡排序更受欢迎 ?

    冒泡排序和插入排序的时间复杂度都是 O(n2),都是原地排序算法,为什么插入排序要比冒泡排序更受欢迎呢 ?

    这里关乎到 逆序度、满有序度、有序度。

    • 有序度:是数组中具有有序关系的元素对的个数。
      有序元素对用数学表达式表示就是这样:
    有序元素对:a[i] <= a[j], 如果 i < j。
    
    • 满有序度:把完全有序的数组的有序度叫作 满有序度

    • 逆序度:正好跟有序度相反(默认从小到大为有序)。

    逆序元素对:a[i] > a[j], 如果 i < j。
    

    同理,对于一个倒序排列的数组,比如 6,5,4,3,2,1,有序度是 0;
    对于一个完全有序的数组,比如 1,2,3,4,5,6,有序度就是 n*(n-1)/2 ,也就是满有序度为 15。

    原因

    • 冒泡排序不管怎么优化,元素交换的次数是一个固定值,是原始数据的逆序度。
    • 插入排序是同样的,不管怎么优化,元素移动的次数也等于原始数据的逆序度。
    • 但是,冒泡排序的数据交换要比插入排序的数据移动要复杂,冒泡排序需要 3 个赋值操作,而插入排序只需要 1 个,数据量一旦大了,这差别就非常明显了。

    7. 复杂性对比

    复杂性对比

    名称 平均 最好 最坏 空间 稳定性 排序方式
    冒泡排序 O(n2) O(n) O(n2) O(1) Yes In-place
    插入排序 O(n2) O(n) O(n2) O(1) Yes In-place
    选择排序 O(n2) O(n2) O(n2) O(1) No In-place

    算法可视化工具

    这里推荐一个算法可视化工具。

    算法可视化工具 algorithm-visualizer 是一个交互式的在线平台,可以从代码中可视化算法,还可以看到代码执行的过程。

    效果如下图。

    算法可视化工具

    8. 最后

    喜欢就点个小星星吧。

    文中所有的代码及测试事例都已经放到我的 GitHub 上了。

    参考文章:

  • 相关阅读:
    冲刺4
    冲刺3
    冲刺2
    冲刺一
    构建之法阅读笔记04
    数组02开发日志
    进度条第七周
    《构建之法》阅读问题
    软件工程概论第一节
    《大道至简》弟七八章读后感
  • 原文地址:https://www.cnblogs.com/biaochenxuying/p/11444593.html
Copyright © 2011-2022 走看看