zoukankan      html  css  js  c++  java
  • Prototype源码浅析——Enumerable部分(二)

    剩下的方法太多,于是分作两部分。

    亮点就是$break和$continue,以及grep方法的思想。

      前面each方法中掉了一个方面没有说,就是源码中的$break和$continue。这两个变量是预定义的,其作用相当于普通循环里面的break和continue语句的作用。出于效率的考虑,在某些操作中并不需要完全遍历一个集合(不局限于一个数组),所以break和continue还是很必要的。

    对于一个循环来说,对比下面几种退出循环的方式:

        var array_1 = [1,2,3];
    var array_2 = ['a','b','c'];
    (function(){
    for(var i = 0, len = array_1.length; i < len; i++){
    for(var j = 0, len_j = array_1.length; i < len_j; j++){
    if('c' === array_2[j]){
    break;
    }
    console.log(array_2[j]);
    }
    }
    })();//a,b,a,b,a,b
    (function(){
    for(var i = 0, len = array_1.length; i < len; i++){
    try{
    for(var j = 0, len_j = array_1.length; i < len_j; j++){
    if('c' === array_2[j]){
    throw new Error();
    }
    console.log(array_2[j]);
    }
    }catch(e){
    console.log('退出一层循环');
    }
    }
    })();//a,b,'退出一层循环',a,b,'退出一层循环',a,b,'退出一层循环'
    (function(){
    try{
    for(var i = 0, len = array_1.length; i < len; i++){
    for(var j = 0, len_j = array_1.length; i < len_j; j++){
    if('c' === array_2[j]){
    throw new Error();
    }
    console.log(array_2[j]);
    }
    }
    }catch(e){
    console.log('退出一层循环');
    }
    })();//a,b,'退出一层循环'

      当我们把错误捕获放在相应的循环层面时,就可以中断相应的循环。可以实现break和break label的作用(goto)。这样的一个应用需求就是可以把中断挪到外部去,恰好符合Enumerable处的需求。

      回到Enumerable上来,由于each(each = function(iterator, context){})方法的本质就是一个循环,对于其第一个参数iterator,并不包含循环,因此直接调用break语句会报语法错误,于是Prototype源码中采用上面的第二种方法。

        Enumerable.each = function(iterator, context) {
    var index = 0;
    try{
    this._each(function(value){
    iterator.call(context, value, index++);
    });
    }catch(e){
    if(e != $break){
    throw e;
    }
    }
    return this;
    };

      一旦iterator执行中抛出一个$break,那么循环就中断。如果不是$break,那么就抛出相应错误,程序也稳定点。这里的$break的定义并没有特殊要求,可以按照自己的喜好随便更改,不过意义不大。

    Enumerable中的某些方法在一些现代浏览器里面已经实现了(参见chrome原生方法之数组),下面是一张对比图:

      在实现这些方法时,可以借用原生方法,从而提高效率。不过源码中并没有借用原生的部分,大概是因为Enumerable除了混入Array部分外,还需要混入其他的对象中。

      看上面的图示明显可以看得出,each和map 的重要性,map其实本质还是each,只不过each是依次处理集合的每一项,map是在each的基础上,还把处理后的结果返回来。在Enumerable内部,map是collect方法的一个别名,另一个别名是select,其内部全部使用的是collect这个名字。

    检测:all | any | include

    这三个方法不涉及对原集合的处理,返回值均是boolean类型。

    all : 若 Enumerable 中的元素全部等价于 true,则返回 true,否则返回 false

      function all(iterator, context) {
    var result = true;
    this.each(function(value, index) {
    result = result && !!iterator.call(context, value, index);
    });
    return result;
    }

      对于all方法来说,里面的两个参数都不是必须的,所以,内部提供了一个函数,以代替没有实参时的iterator,直接返回原值,名字叫做Prototype.K。Prototype.K的定义在库的开头,是一个返回参数值的函数Prototype.K = function(x){return x;}。另外,在all方法中,只要有一个项的处理结果为false,整个过程就可以放弃(break)了,于是用到了本文开头的中断循环的方法。最后的形式就是:

      Prototype.K = function(){};
    Enumerable.all = function(iterator, context) {
    iterator = iterator || Prototype.K;
    var result = true;
    this.each(function(value, index) {
    result = result && !!iterator.call(context, value, index);
    if (!result) throw $break;
    });
    return result;
    }

      最后返回的result是一个boolean型,偏离一下all,我们改一下result:

      function collect(iterator, context) {
    iterator = iterator || Prototype.K;
    var results = [];
    this.each(function(value, index) {
    results.push(iterator.call(context, value, index));
    });
    return results;
    }

      此时results是一个数组,我们不中断处理过程,保存所有的结果并返回,恩,这就是collect方法,或者叫做map方法。


    any:若 Enumerable 中的元素有一个或多个等价于 true,则返回 true,否则返回 false,其原理和all差不多,all是发现false就收工,any是发现true就收工。
    
    
      function any(iterator, context) {
    iterator = iterator || Prototype.K;
    var result = false;
    this.each(function(value, index) {
    if (result = !!iterator.call(context, value, index))
    throw $break;
    });
    return result;
    }
    include:判断 Enumerable 中是否存在指定的对象,基于 == 操作符进行比较
      这个方法有一步优化,就是调用了indexOf方法,对于数组来说,indexOf返回-1就不可以知道相应元素不存在了,如果集合没有indexOf方法,就只能查找比对了。这里的查找和没有任何算法,一个个遍历而已,如果要改写也容易,不过平时应用不多,因此估计也没有花这个精力去优化这个。所以如果结果为true的时候效率比结果为false的时候要高一些,看运气了。
    
    
      function include(object) {
    if (Object.isFunction(this.indexOf))//这个判定函数应该很熟悉了
    if (this.indexOf(object) != -1) return true;//有indexOf就直接调用

    var found = false;
    this.each(function(value) {//这里的效率问题
    if (value == object) {
    found = true;
    throw $break;
    }
    });
    return found;
    }

    下面是一组过滤数据的方法:
    返回单个元素:max | min | detect
    返回一个数组:grep | findAll | reject | partition 
    其中max和min并不局限于数字的比较,字符的比较一样可以。
    
    
    max(iterator, context)依旧可以带有两个参数,可以先用iterator处理之后再来比较值,这样的好处就是不必局限于特定的数据类型,比如,对象数组按照一定规则取最大值:
    console.dir([{value : 3},{value : 1},{value : 2}].max(function(item){
    return item.value;
    }));//3
    因此源码的实现方式可以想象,直接比较的时候,实现方式可以如下:
      function max() {
    var result;
    this.each(function(value) {
    if (result == null || value >= result) //result==null是第一次比较
    result = value;
    });
    return result;
    }
    扩展之后,value要进一步变为value = (iterator处理后的返回值):
      function max(iterator, context) {
    iterator = iterator || Prototype.K;
    var result;
    this.each(function(value, index) {
    value = iterator.call(context, value, index);
    if (result == null || value >= result)
    result = value;
    });
    return result;
    }
    min的原理也一样。
    detect和any的原理和接近,any是找到一个true就返回true,detect是找到一个true就返回满足true条件的那个值。源码就不贴了。
    
    
    
    
    grep 这个很眼熟啊,一个unix/linux工具,其作用也很眼熟——就是返回所有和指定的正则表达式匹配的元素。
    只不过unix/linux只能处理字符串,这里扩展了范围,但是基本形式还是没有变。如果集合的每一项都是字符串,那么实现起来回事这样:
        Enumerable.grep = function(filter) {
    if(typeof filter == 'string'){
    filter = new RegExp(filter);
    }
    var results = [];
    this.each(function(value,index){
    if(value.match(filter)){
    results.push(value);
    }
    })
    return results;
    };
    但是有一现在要处理的集合可能并都是字符串,为了达到更广泛的应用,首先要考虑的就是调用形式。看上面的实现,注意这么一句:
    if(value.match(filter))
    其中value是个字符串,match是String的方法,现在要扩展所支持的类型,要么给每一个value都加上match方法,要么转换形式。显然第一种巨响太大,作者转换了思路:
    if (filter.match(value))
    这么一来,不论value为何值,只要filter有对应的match方法即可,上面对于RegExp对象,是没有match方法的,于是在源码中,作者扩展了RegExp对象:
    RegExp.prototype.match = RegExp.prototype.test;
    注意上面的match和String的match有本质区别。
    这么一来,如果value是对象,我们的filter只需要提供相应的检测对象的match方法即可。
    于是就有:
      function grep(filter, iterator, context) {
    iterator = iterator || Prototype.K;
    var results = [];

    if (Object.isString(filter))
    filter = new RegExp(RegExp.escape(filter));

    this.each(function(value, index) {
    if (filter.match(value))//原生filter是没有match方法的。
    results.push(iterator.call(context, value, index));
    });
    return results;
    }
    
    
      对于匹配的结果,可以处理之后再返回,这就是iterator参数的作用。不同于max方法,grep是进行主要操作时候再用iterator来处理结果,max是用iterator处理源数据之后再来进行主要操作。因为grep中的filter代替了max中iterator的作用。
    至于findAll,是grep的加强版,看过grep,findAll就很简单了。reject就是findAll的双子版本,作用正好相反。partition就是findAll + reject,组合亲子版本。
    
    
    转载请注明来自小西山子【http://www.cnblogs.com/xesam/
    本文地址:http://www.cnblogs.com/xesam/archive/2012/01/17/2324681.html
  • 相关阅读:
    jquery判断元素是否可见隐藏
    jQuery的replaceWith()函数用法详解
    前端工作面试问题
    Windows下安装sass和compass失败的解决办法
    马尾图案之canvas的translate、scale、rotate的方法详解
    boost bimap
    boost multi index
    boost regex expression
    boost format
    boost lexical_cast
  • 原文地址:https://www.cnblogs.com/xesam/p/2324681.html
Copyright © 2011-2022 走看看