zoukankan      html  css  js  c++  java
  • JS高级-数据结构的封装

    最近在看了《数据结构与算法JavaScript描述》这本书,对大学里学的数据结构做了一次复习(其实差不多忘干净了,哈哈)。如果能将这些知识捡起来,融入到实际工作当中,估计编码水平将是一次质的飞跃。带着这个美好的愿望,开始学习吧O(∩_∩)O~~

    我们知道在JS中,常常用来组织数据的无非是数组和对象(这些基础就不介绍了)。但在数据结构中,还有一些抽象的数据类型:列表、栈、队列、链表、字典、散列、集合、二叉树、图等,可以用来更好的对实际场景建模。当然这些数据类型,原生JS不支持,那么就需要通过封装来模拟,其底层还是数组和对象(被看穿喽~),接下来我们挨个来解析吧

     

    一、列表

    定义:列表是一组有序的数据,每个列表中的数据项称为元素元素可以是任意数据类型, 也不事先限定元素个数。 

    生活中经常使用到列表,通讯录、购物车、十佳榜单等。当不需要在一个很长的序列中查找元素或排序可以使用列表。

    列表的封装代码:

    function List() {//列表的构造函数
        this._dataStore = []; //初始化一个空数组来保存列表元素
        this._pos = 0;//当前的位置
    }
    List.prototype={
        constructor:List,
        clear:function(){//清空列表
            delete this._dataStore;
            this._dataStore = []; this._pos = 0;
        },
        find:function(element){//在列表中查找某一元素,若有返回位置,否则返回-1
            for (var i = 0; i < this._dataStore.length; ++i) {
                if (this._dataStore[i] === element) {return i;}
            };return -1;
        },
        contains:function(element){//判断给定值是否在列表中
            for (var i = 0; i < this._dataStore.length; ++i) {
                if (this._dataStore[i] === element) {return true; break;}
            };return false;
        },
        insert:function(element, after){//当前位置插入新元素
            var insert_pos = this.find(after);
            if (insert_pos > -1) {this._dataStore.splice(insert_pos+1, 0, element);return true;};
            return false;
        },
        append:function(element){this._dataStore[this._dataStore.length] = element;},//末尾添加新元素
        remove:function(element){//删除元素
            var foundAt = this.find(element);
            if (foundAt > -1) {this._dataStore.splice(foundAt,1);return true;};
            return false;
        },
        front:function(){this._pos = 0;},//将当前位置指针设为表首
        end:function(){this._pos = this._dataStore.length-1;},//将当前位置指针设为表尾
        prev:function(){if (this._pos > 0) {--this._pos;}},//当前位置上移指针
        next:function(){if (this._pos < this._dataStore.length-1) {++this._pos;}},//当前位置下移指针
        moveTo:function(_position){this._pos = _position;},//移动当前位置指针到指定位置
        length:function(){return this._dataStore.length;},//获取列表的中元素的个数
        curr_pos:function(){return this._pos;},//返回当前位置指针
        getElement:function(){return this._dataStore[this._pos];},//返回当前位置的列表项
        toString:function(){return this._dataStore;}//返回列表的字符串形式
    }

    列表与数组比较类似,只是简单的对数组做了二次封装,用案例来展示一下列表的使用场景,进一步加深理解。

    案例:影碟租赁自助查询系统

    var moviearr=['肖申克的救赎','教父','教父 2','低俗小说','黄金三镖客','十二怒汉','辛德勒名单','黑暗骑士','指环王:王者归来','搏击俱乐部','星球大战5:帝国反击战','飞越疯人院','指环王:护戒使者','盗梦空间','好家伙','星球大战','七武士','黑客帝国','阿甘正传','上帝之城']//数据
    
    var movieList = new List();//电影列表
    for (var i = 0; i < moviearr.length; ++i) {movieList.append(moviearr[i]);}//将数据添加到‘电影列表’
    var customerList = new List();//客户列表
    function Customer(name, movie) {//客户租赁对象的构造函数
        this.name = name;
        this.movie = movie;
    }
    
    function checkOut(name, movie, movieList, customerList) {//某客户需要租赁某电影,同时维护两个列表
            if(movieList.contains(movie)){//若检索电影在列表中,新建客户对象添加到客户列表,同时在电影列表中删除该电影
                var c = new Customer(name, movie);
                customerList.append(c);
                movieList.remove(movie);
            }else{console.log(movie + " is not available.");}//若不在电影列表中,则提示不可租赁
            //打印维护后的两个列表
            console.log('movieList:'+movieList.toString()+'
     customerList:'+JSON.stringify(customerList.toString()))
        }
    
    checkOut('gavin','黑客帝国',movieList,customerList)
    checkOut('gavin','星球大战',movieList,customerList)
    checkOut('zoe','辛德勒名单',movieList,customerList)
    checkOut('gulei','黑客帝国',movieList,customerList)
    View Code

    二、栈

    定义:栈是一种特殊的列表, 栈内的元素只能通过列表的一端访问, 这一端称为栈顶。 

    栈是一种后入先出( LIFO, last-in-first-out) 的数据结构,任何不在栈顶的元素都无法访问。 为了得到栈底的元素, 必须先拿掉上面的元素。生活中常见的例子如:餐厅的一摞盘子,只能从上面逐个取,洗净的盘子也只能摞在最上面。

    栈的封装代码:

    function Stack() {//栈的构造函数
        this._dataStore = [];//初始化一个空数组来保存列表元素
        this._top = 0;//记录栈顶的位置
    }
    Stack.prototype={
        constructor:Stack,
        clear:function(){//清空栈
            delete this._dataStore;
            this._dataStore = []; this._top = 0;
        },
        push:function(element){this._dataStore[this._top++] = element;},//向栈内添加元素
        pop:function(){return this._dataStore[--this._top];},//从栈内取出元素
        peek:function(){return this._dataStore[this._top-1]},//查看栈顶元素
        length:function(){return this._top;}//获取列表的中元素的个数
    }

    相对列表来说,栈的方法不多显得很简洁,同样来几个案例,帮助理解栈的使用场景

    案例一:回文

    function isPalindrome(word){
        var s = new Stack();
        for (var i = 0; i < word.length; ++i) {s.push(word[i]);}
        var rword = "";
        while (s.length() > 0) {rword += s.pop();}
        if (word == rword) {return true;}else {return false;}
    }
    console.log(isPalindrome("hello"));//false
    console.log(isPalindrome("racecar"));//true
    View Code

    案例二:递归演示

    function factorial(n) {
        if (n === 0) {return 1;}else {return n * factorial(n-1);}
    }
    function fact(n) {
        var s = new Stack();
        while (n > 1) {s.push(n--);}
        var product = 1;
        while (s.length() > 0) {product *= s.pop();}
        return product;
    }
    console.log(factorial(5))//120
    console.log(fact(5))//120
    View Code

    三、队列

    定义:列队也是一种特殊的列表, 不同的是队列只能在队尾插入元素, 在队首删除元素。 

    列队是一种先进先出First-In-First-OutFIFO的数据结构。排在前面的优先处理,后面的依次排队,直到轮到它。生活中常见的例子如:打印任务池,模拟柜台排队的顾客等

    队列的封装代码:

    function Queue() {//队列的构造函数
        this._dataStore = [];//初始化一个空数组来保存元素
    }
    Queue.prototype={
        constructor:Queue,
        clear:function(){//清空队列
            delete this._dataStore;
            this._dataStore = []; this._top = 0;
        },
        enqueue:function(element){this._dataStore.push(element)},//向队尾添加一个元素
        dequeue:function(){return this._dataStore.shift();},//删除队首元素
        front:function(){return this._dataStore[0];},//读取队首元素
        back:function(){return this._dataStore[this._dataStore.length-1];},//读取队尾元素
        empty:function(){if(this._dataStore.length === 0){return true;}else{return false;}},//判断队列是否为空
        toString:function(){//将队列元素拼接字符串
            var retStr = "";
            for (var i = 0; i < this._dataStore.length; ++i) {retStr += this._dataStore[i] + ",";}
            return retStr;
        }
    }

     列队比栈稍微复杂一点,总体来说也是比较容易理解的。

    案例:舞伴分配

    function Dancer(name, sex) {
        this.name = name;
        this.sex = sex;
    }
    
    function getDancers(males, females) {
        var names = ['F Allison McMillan','M Frank Opitz','M Mason McMillan','M Clayton Ruff','F Cheryl Ferenback','M Raymond Williams','F Jennifer Ingram','M Bryan Frazer','M David Durr','M Danny Martin','F Aurora Adney'];
        for(var i = 0; i < names.length; ++i) {
            var dancer = names[i].split(" ");
            var sex = dancer[0];
            var name = dancer[1];
            if (sex == "F") {females.enqueue(new Dancer(name, sex));
            } else {males.enqueue(new Dancer(name, sex));}
        }
    }
    function dance(males, females) {
        console.log("The dance partners are: 
    ");
        while (!females.empty() && !males.empty()) {
            var person1 = females.dequeue();
            var person2 = males.dequeue();
            console.log("Female dancer is: " + person1.name+" and the male dancer is: " + person2.name);
        }
    }
    var maleDancers = new Queue();
    var femaleDancers = new Queue();
    getDancers(maleDancers, femaleDancers);
    dance(maleDancers, femaleDancers);
    if (!femaleDancers.empty()) {console.log(femaleDancers.front().name + " is waiting to dance.");}
    if (!maleDancers.empty()) {console.log(maleDancers.front().name + " is waiting to dance.");}
    View Code

    在一般情况下,从列表中删除元素是优先删除先入队的元素,但有时候也可能需要使用一种优先队列的数据来模拟,比如医院的急诊,主要通过给队列中每个元素添加一个优先级别,并改写dequeue方法实现。

    dequeue:function() {
        var priority = this._dataStore[0].code;//code表示优先级别,数值越小优先级越高
        for (var i = 1; i < this._dataStore.length; ++i) {priority =Math.min(priority,i);} 
        return this.dataStore.splice(priority,1);
    }

    四、链表

    定义:链表是由一组节点组成的集合,每个节点都使用一个对象的引用指向下一个节点,这个引用叫做

    除了对数据的随机访问,链表几乎可以代替一维数组。它与数组的主要区别是:数组的元素靠位置进行引用,链表靠相互指向进行引用。

    链表的封装代码:

    function Node(element) {//链表中节点的构造函数
        this.element = element;
        this.next = null;
    }
    function LList() {//链表的构造函数
        this.head = new Node("head");
    }
    LList.prototype={
        constructor:LList,
        find:function(item){//查找链表,如果找到则返回该节点,否者返回头节点
            var currNode = this.head;
            while (currNode.element != item) {currNode = currNode.next;} 
            return currNode;
        },
        insert:function(newElement, item){//在找到的节点后,新增一个节点
            var newNode = new Node(newElement);//新增节点
            var current = this.find(item);//查找节点
            newNode.next = current.next;//先将当前节点的next赋值给新节点的next
            current.next = newNode;//再将当前节点的next设置为新节点
        },
        display:function(){
            var currNode = this.head;
            while (currNode.next!==null){console.log(currNode.next.element);currNode = currNode.next; }
        },
        findPrev:function(item){//查找链表,返回当前节点的上一个节点
            var currNode = this.head;
            while (currNode.next!==null && currNode.next.element!==item){ currNode = currNode.next; }
            return currNode;
        },
        remove:function(item){//在链表中删除给定的节点
            var prevNode = this.findPrev(item);
            if (prevNode.next !== null) { prevNode.next = prevNode.next.next;}
        }
    }

    跟之前的三种数据结构不同,链表没有采用数组作为底层数据存储。而是采用对象节点作为基础,同时每个节点中都含有一个next属性指向另一个对象,与优先队列的中的优先级别code颇为类似。总体来看链表是通过每个节点的next属性,将散列的对象连接到了一起

    如上我们只是实现了单向链表,从头遍历到尾很简单,想要反过来遍历就没那么容易了。我们可以通过给节点增加一个prev属性,指向它的前一个节点,也能实现双向链表。当然,双向链表在新增和删除节点时的操作也要复杂一些,需要同时修改前后节点的next或prev属性。

    另外,我们还可以让单向链表的尾节点指向首节点,这样就变成了循环列表。这样需要对链表的一些方法进行改造,防止遍历链表时出现无限循环。

    五、字典

    定义:字典是一种以键值对形式存储的数据结构。

    JS中对象就是以字典的形式设计的,但字典的基础是数组,而不是对象。这样可以进行排序,况且JS中一切皆对象,数组也不例外。

    字典的封装代码:

    function Dictionary() {//字典的构造函数
        this._datastore = new Array();
    }
    Dictionary.prototype={
        constructor:Dictionary,
        add:function(key,value){ this._datastore[key]=value; },//增加一条键值对
        find:function(key){ return this._datastore[key] },//查找指定key,返回对应value的值
        remove:function(key){ delete this._datastore[key] },//删除指定key的键值对
        showAll:function(){ //打印字典的所有键值对
            //若需排序可以给Object.keys(this._datastore)数组追加sort方法
            Object.keys(this._datastore).forEach(function(key){console.log(key+" -> "+this._datastore[key]);}.bind(this)) 
        },
        count:function(){//返回字典所含键值对数量
            var n = 0;
            for(var key in this._datastore) {++n;}
            return n;
        },
        clear:function(){ //清空字典
            Object.keys(this._datastore).forEach(function(key){ delete this._datastore[key];}.bind(this))
        }
    }

    字典依然采用数组作为底层数据存储,但是与普通按序号索引的数组不同,它只能以key进行查询。

    六、散列

    定义:散列是一种常用的数据存储技术, 散列后的数据可以快速地插入或取用。 散列使用的数据结构叫做散列表

    是通过一个散列函数(Hash,哈希)将键映射为一个范围是 到散列表长度的数字。

    散列的封装代码:

    function HashTable() {//散列的构造函数
        this._table = new Array(137);//数组的长度应该为质数,即预算散列表的长度
    }
    HashTable.prototype={
        constructor:HashTable,
        simpleHash:function(data){//简单的散列函数(返回键字符串的ASCII累加除数组长度的余数)
            var total = 0;
            for (var i = 0; i < data.length; ++i) {total += data.charCodeAt(i);}
            return total % this._table.length;
        },
        betterHash:function(data){//更好的散列函数算法,减少碰撞
            const H = 37;
            var total = 0;
            for (var i = 0; i < data.length; ++i) {total += H * total + data.charCodeAt(i);} 
            total = total % this._table.length;
            if (total < 0) {total += this._table.length-1;}
            return parseInt(total);
        },
        put:function(data){var pos = this.simpleHash(data);this._table[pos] = data;},//使用简单散列函数
        //put:function(key,data){var pos = this.betterHash(key);this._table[pos] = data;},//使用高级散列函数
        showDistro:function(){//显示散列表中的数据
            var n = 0;
            for (var i = 0; i < this._table.length; ++i) {
                if (this._table[i] !== undefined) {console.log(i + ": " + this._table[i]);}
            }
        },
        get:function(key){return this._table[this.betterHash(key)];},
    }

    散列其实是通过一种机制(散列函数),将数据存储到散列表对应的位置上去,当机制跟内容相关时仅出现修改才会改变。(MD5类似散列函数的机制)

    当散列函数对于多个输入产生同样的输出时称为碰撞。开链法(用数组存储多个相同输出)和探测法(线性探测下个位置,直到有空值存入)

    案列:数据存储

    var students = ["David", "Jennifer", "Donnie", "Raymond", "Cynthia", "Mike", "Clayton", "Danny", "Jonathan"];
    var hTable = new HashTable();
    for (var i = 0; i < students.length; ++i) {hTable.put(students[i]);}
    hTable.showDistro();//九条数据,被散列成八条,产生于了一个碰撞
    View Code

    七、集合

    定义:是一种不含不同元素的数据结构,这些元素是无序且不重复的。

    集合的封装代码:

    function Set() {//集合的构造函数
        this._dataStore = [];
    }
    Set.prototype={
        constructor:Set,
        add:function(data){//向集合中添加元素
            if (this._dataStore.indexOf(data) < 0) {this._dataStore.push(data);return true;
            } else {return false;}
        },
        remove:function(data){//从集合中移除元素
            var pos = this._dataStore.indexOf(data);
            if (pos > -1) {this._dataStore.splice(pos,1);return true;
            } else {return false;}
        },
        contains:function(){//检查一个元素是否在集合中
            if (this._dataStore.indexOf(data) > -1) {return true;} else {return false;}
        },
        size:function(){return this._dataStore.length},//返回集合的长度
        union:function(set){//返回与另一个集合的并集
            var tempSet = new Set();
            for (var i = 0; i < this._dataStore.length; ++i) {tempSet.add(this._dataStore[i]);}
            for (var i = 0; i < set.dataStore.length; ++i) {
                if (!tempSet.contains(set.dataStore[i])) {tempSet.dataStore.push(set.dataStore[i]);}
            } 
            return tempSet;
        },
        intersect:function(set){//返回与另一个集合的交集
            var tempSet = new Set();
            for (var i = 0; i < this._dataStore.length; ++i) {
                if (set.contains(this._dataStore[i])) {tempSet.add(this._dataStore[i]);}
            } 
            return tempSet;
        },
        subset:function(set){//判断集合是否其他集合的子集
            if (this.size() > set.size()) {return false;
            } else {
                this._dataStore.foreach(function(member){if (!set.contains(member)) {return false;}})
            } 
            return true;
        },
        difference:function(set){//返回与另一个集合的补集
            var tempSet = new Set();
            for (var i = 0; i < this._dataStore.length; ++i) {
                if (!set.contains(this._dataStore[i])) {tempSet.add(this._dataStore[i]);}
            } 
            return tempSet;
        },
        show:function(){return this._dataStore;},//显示集合中的元素
    }

    集合的数据结构比较简单,主要实现了添加元素时检查唯一性,以及交集、并集、补集的方法和子集的检查。

    八、二叉树和二叉查找树

    定义:树由一组以连接的节点组成,二叉树是子节点不超过两个的特殊树。

    二叉树的封装代码:

    function Node2(data, left, right) {//二叉树中节点的构造函数
        this.data = data;
        this.left = left;
        this.right = right;
        this.show = function(){return this.data;};
    }
    function BST(){//二叉查找树的构造函数
        this.root = null;
    }
    BST.prototype={
        constructor:BST,
        insert:function(data){//插入节点
            var n = new Node2(data, null, null);
            if (this.root == null) {
                this.root = n;
            } else {
                var current = this.root;
                var parent;
                while (true) {
                    parent = current;
                    if (data < current.data) {
                        current = current.left;if (current == null) {parent.left = n;break;}
                    } else {
                        current = current.right;if (current == null) {parent.right = n;break;}
                    }
                }
            }
        },
        inOrder:function(node){
            if (!(node == null)) {
            this.inOrder(node.left);
            console.log(node.show() + " ");
            this.inOrder(node.right);
            }
        },
        getMin:function(){//获取最小的数,即最左节点
            var current = this.root;
            while (!(current.left == null)) {current = current.left;}
            return current.data;
        },
        getMax:function(){//获取最大的数,即最右节点
            var current = this.root;
            while (!(current.right == null)) {current = current.right;}
            return current.data;
        },
        find:function(data){//查找指定的值
            var current = this.root;
            while (current != null) {
                if (current.data == data) {return current;
                } else if (data < current.data) {current = current.left;
                } else {current = current.right;}
            } 
            return null;
        },
        remove:function(data){ root = this.removeNode(this.root, data);},//调用removeNode删除节点
        removeNode:function(node,data){ //删除节点
            if (node == null) {return null;}
            if (data == node.data) {
                if (node.left == null && node.right == null) {return null;} // 没有子节点的节点
                if (node.left == null) {return node.right;} // 没有左子节点的节点
                if (node.right == null) {return node.left;} // 没有右子节点的节点
                // 有两个子节点的节点
                var tempNode = getSmallest(node.right);
                node.data = tempNode.data;
                node.right = removeNode(node.right, tempNode.data);
                return node;
            } else if (data < node.data) {
                node.left = removeNode(node.left, data);
                return node;
            } else {
                node.right = removeNode(node.right, data);
                return node;
            }
        }
    }

    二叉树有点类似链表的数据结构,采用节点的左右属性来指向两个子节点。

    九、图和图算法

    定义:图是由边的集合即顶点的集合组成的。常用于地图和航班等信息数据的建模。

    图的封装代码:

    function Graph(v) {//图的构造函数,v表示顶点的数量
        this.vertices = v;
        this.edges = 0;
        this.adj = [];
        for (var i = 0; i < this.vertices; ++i) {
            this.adj[i] = [];
            this.adj[i].push("");
        }
        this.marked = [];//遍历标志位
        for (var i = 0; i < this.vertices; ++i) {this.marked[i] = false;}
        this.edgeTo = [];//路径查找时,存储两个顶点之间的边
    }
    Graph.prototype={
        constructor:Graph,
        addEdge:function(v,w){//增加一条从顶点v到顶点w的边
            this.adj[v].push(w);
            this.adj[w].push(v);
            this.edges++;
        },
        showGraph:function(){var p='';//显示当前图的结构
            for (var i = 0; i < this.vertices; ++i) { p+='顶点'+i+' ->';
                for (var j = 0; j < this.vertices; ++j) {
                    if (this.adj[i][j] !== undefined){ p+=this.adj[i][j]+' ';}
                };p+='
    ';
            }console.log(p)
        },
        dfs:function(v){//深度优先搜索
            this.marked[v] = true;
            if (this.adj[v] !== undefined) {console.log("深度优先: " + v);}
            for(var w in this.adj[v]) {
                if(!this.marked[this.adj[v][w]]){this.dfs(this.adj[v][w]);}
            }
        },
        bfs:function(s){//广度优先搜索
            var queue = [];
            this.marked[s] = true;
            queue.push(s); // 添加到队尾
            while (queue.length > 0) {
                var v = queue.shift(); // 从队首移除
                if (v!==''&&v !== undefined) {console.log("广度优先: " + v);} 
                for(var w in this.adj[v]) {
                    if (!this.marked[this.adj[v][w]]) {
                        this.marked[this.adj[v][w]] = true;
                        this.edgeTo[this.adj[v][w]] = v;
                        queue.push(this.adj[v][w]);
                    }
                }
            }
        },
        pathTo:function(v){//获取最短路径,即顶点v到顶点0的边(必须先广度搜索生成edgeTo)
            var source = 0;
            if (!this.marked[v]) {return undefined;}
            var path = [];
            for (var i = v; i != source; i = this.edgeTo[i]) {path.push(i);}
            path.push(source);
            return path;
        }
    }

    在对图数据模型进行搜索时,有深度优先和广度优先两种。当进行最短路径查找时,就是广度优先搜索的过程。

  • 相关阅读:
    为什么你的Excel很丑?
    老白聊数据-为什么你的营销总是没有效?
    零售企业需要什么技术和策略
    老白聊数据-关于销售预测的那些事
    在大数据时期的营销该是什么样子的
    基于数据驱动的活动该如何设计
    DAU新解
    小白学数据分析----->DNU/DAU
    [db]db学习笔记(目录)
    [net]网络工程学习笔记(目录)
  • 原文地址:https://www.cnblogs.com/gulei/p/6857460.html
Copyright © 2011-2022 走看看