先说说这个实例的要求:写一个方法实现数组的去重。(要求:执行方法,传递一个数组,返回去重后的新数组,原数组不变,实现过程中只能用一层循环,双层嵌套循环也可写,只做参考);
先给初学者解释一下什么叫数组去重(老鸟跳过):意思就是讲数组里面重复的元素去掉,比如说var arr = [3,2,4,2,1,2]; 数组去重得到的新数组是 [3,2,4,1],就是这么一个功能。
实现方法比较简单,实现的方式也比较多,很多大牛也写过相关的文章,之所以写这边博客,旨在一是备忘,二是给初学者能更好的理解其实现的原理,好,我们看第一种实现方式:
第一种,通过遍历新数组来去重
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
var arr = [1, 'b' , 'b' ,4,3,3,4,5,1]; //第一种 Array.prototype.unique1 = function (){ var arr1 = []; //定义一个新数组 for ( var i=0;i< this .length;i++){ if (arr1.indexOf( this [i]) == -1){ //判断目标数组中在原数组里是否存在 arr1.push( this [i]); } } return arr1; } console.log(arr); //[1,'b','b',4,3,3,4,5,1] console.log(arr.unique1()); //[1, "b", 4, 3, 5] //这种方法的主要思路就是,新建一个数组,然后在原数组中,从第一个开始,看看新数组里面有没有这个元素,如果有,就忽略,然后进行下一个,如果没有,则把这个元素存到新数组里面, //也就是说,每一次比较,都会遍历新数组,直到找到相同元素为止,比较耗性能 |
如果大家不习惯这个写法,可以改成下面的写法,效果是一样的:
1
|
var arr = [1, 'b' , 'b' ,4,3,3,4,5,1]; |
1
2
3
4
5
6
7
8
9
10
11
|
function unique1(arr){ var arr1 = []; for ( var i=0;i<arr.length;i++){ if (arr1.indexOf(arr[i]) == -1){ //判断目标数组中在原数组里是否存在 arr1.push(arr[i]); } } return arr1; } console.log(arr); //[1,'b','b',4,3,3,4,5,1] console.log(unique1(arr)); //[1, "b", 4, 3, 5] |
下面的方法我就不改写法了,你们可以按照上面的格式来改写一下,结果我也不输出了,因为结果是一样的,注释写在代码中,慢慢体会一下
第二种,通过hash表(这个概念有点大,具体原理就不在这里细说了,有时间我会单独写一遍,这是好东西)实现
1
|
var arr = [1, 'b' , 'b' ,4,3,3,4,5,1]; |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
Array.prototype.unique2 = function (){ var hash = {}; //定义一个hash表 var arr1 = []; //定义一个新数组 for ( var i=0;i< this .length;i++){ /* 这里比较难理解,我们一步一步来看: hash是一个对象,则存在键值对(key:value),只不过现在是为空的,所以hash[key] = value; 第一步:i=0;this[i]=this[0]=1; hash[this[0]] = hash[1] , 因为hash初始为空,没有找到key=1的值,所以然后undefined, 执行下一步:hash[1] = true(此时hash对象就有了第一组键值对),将原数组的第一个数添加到新数组中,重复第一步 因为不重复的判断hash的值都是undefined,而重复的都为true了,所以不重复都被添加到新数组中 因为hash表存的值是存的地址,放在堆内存中,所以有多少个不重复的元素,就要分多少个内存来存放,所以这种方法比较占内存,但是相比之下,这种的运算运动是最快的, 这也就是用空间来换取时间了,数据量比较小,推荐用此方法 */ if (! hash[ this [i]]){ hash[ this [i]] = true ; arr1.push( this [i]); } } return arr1; } console.log(arr); console.log(arr.unique2()); |
第三种,通过遍历自身的位置是否一致来实现
1
|
var arr = [1, 'b' , 'b' ,4,3,3,4,5,1]; |
1
2
3
4
5
6
7
8
9
10
11
12
|
Array.prototype.unique3 = function (){ var arr1 = []; //定义一个新数组 for ( var i=0;i< this .length;i++){ if ( this .indexOf( this [i])==i){ //这里也是indexOf遍历,看从第一个元素在原数组中的位置,如果第一次出现的位置和下标相等,说明当前元素的不重复的,如果不等,说明该元素前面已经出现过 arr1.push( this [i]); } } return arr1; } console.log(arr); console.log(arr.unique3()); |
第四种,这个有点意思,只能运用到特殊场合,就是先跟数组排序,然后22比较,输出一个排序过的新数组
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
Array.prototype.unique4 = function (){ /* 这里是思路是,先排序(默认从小到大),然后将原数组的第一个给新数组, 因为是经过排序的,所以重复的只会存在在相邻位置 这里就相当于是做22比较,如果相等,则进行下一组,如果不相等,则把这个数存到新数组中,用这个数再进行比较 */ this .sort(); var arr1 = [ this [0]]; for ( var i=1;i< this .length;i++){ if ( this [i] !== arr1[arr1.length-1]){ arr1.push( this [i]); } } return arr1; } console.log(arr); console.log(arr.unique4()); |
哇哈,打完收工!
要求里面还说,可以使用双层嵌套循环来实现,无法就是用2层for循环,让每一个与原数组去比较
1
2
3
4
5
6
7
8
9
10
11
12
13
|
Array.prototype.unique5 = function (){ //双层循环,一一比较 for ( var i=0;i< this .length;i++){ //从0开始 for (j= i+1;j< this .length;j++){ //从1开始,逐个比较 if ( this [i] === this [j]){ //如果恒定 this .splice(j,1); //就将这个元素删掉 } } } return this ; } console.log(arr); console.log(arr.unique5()); |
这种写法的循环次数太多,不推荐,有人会说,第一种和第三种不也是每次都遍历一遍吗?跟第5种感觉也差不多呢?是的,你能这么理解,说明你理解了,但是呢,又不是特别的理解,我们说差不多那可就差太多了,indexOf()表示的是找到第一个匹配的元素就会
停止遍历,而第5种则是不管找不找得到,都会把整个数组遍历一遍,如果数据量大,那你觉得哪个性能要好一点?
特别注意的一点:如果在比较两两之间的值是全等或不等的时候,一定要用恒定(===)和不恒定(!==),因为这会涉及到元素的类型上,如 1与'1'是不恒等的!
上面的可真是干货了,一点水分都没有,只能靠大家自己领悟了!
行文仓促,在下才疏学浅,如果大家有更好的实现方法,请你贴出来学习一下,那就不胜感激了,如果有不对的地方,万望指正,谢谢!