zoukankan      html  css  js  c++  java
  • Java 容器

    List:

      特点:List是有序、可重复的容器。

          有序:List中每个元素都有索引标记。可以根据元素的索引标记(在List中的位置)访问元素,从而精确控制这些元素。

          可重复:List允许加入重复的元素。更确切地讲,List通常允许满足 e1.equals(e2) 的元素重复加入容器。

    1 ArrayList:ArrayList底层是用数组实现的存储。 特点:查询效率高,增删效率低,线程不安全。我们一般使用它。查看源码:

      

      我们可以看出ArrayList底层使用Object数组来存储元素数据。所有的方法,都围绕这个核心的Object数组来开展。

      我们知道,数组长度是有限的,而ArrayList是可以存放任意数量的对象,长度不受限制,那么它是怎么实现的呢?本质上就是通过定义新的更大的数组,将旧数组中的内容拷贝到新数组,来实现扩容。 ArrayList的Object数组初始化长度为10,如果我们存储满了这个数组,需要存储第11个对象,就会定义新的长度更大的数组,并将原数组内容和新的元素一起加入到新数组中,源码如下:

       

    2 LinkedList:底层用双向链表实现的存储。特点:查询效率低,增删效率高,线程不安全。

      双向链表也叫双链表,是链表的一种,它的每个数据节点中都有两个指针,分别指向前一个节点和后一个节点。 所以,从双向链表中的任意一个节点开始,都可以很方便地找到所有节点。存储结构图:

      

      我们查看LinkedList的源码,可以看到里面包含了双向链表的相关代码:  

      

    3 Vector:Vector底层是用数组实现的List,相关的方法都加了同步检查,因此“线程安全,效率低”。 比如,indexOf方法就增加了synchronized同步标记。

      

      4 老鸟建议

      如何选用ArrayList、LinkedList、Vector?

      1. 需要线程安全时,用Vector。

      2. 不存在线程安全问题时,并且查找较多用ArrayList(一般使用它)。

      3. 不存在线程安全问题时,增加或删除元素较多用LinkedList。

    Map

      Map就是用来存储“键(key)-值(value) 对”的。 Map类中存储的“键值对”通过键来标识,所以“键对象”不能重复。

    1 HashMap:HashMap底层实现采用了哈希表,这是一种非常重要的数据结构。

      数据结构中由数组和链表来实现对数据的存储,他们各有特点。

          (1) 数组:占用空间连续。 寻址容易,查询速度快。但是,增加和删除效率非常低。

          (2) 链表:占用空间不连续。 寻址困难,查询速度慢。但是,增加和删除效率非常高。

      Hashmap基本结构讲解

          哈希表的基本结构就是“数组+链表”。我们打开HashMap源码,发现有如下两个核心内容:

      图9-12 HashMap底层源码(1).png

      HashMap底层源码(1)

          其中的Entry[] table 就是HashMap的核心数组结构,我们也称之为“位桶数组”。我们再继续看Entry是什么,源码如下:

      图9-13 HashMap底层源码(2).png

      HashMap底层源码(2)

          一个Entry对象存储了:

          1. key:键对象 value:值对象

          2. next:下一个节点

          3. hash: 键对象的hash值

          显然每一个Entry对象就是一个单向链表结构,我们使用图形表示一个Entry对象的典型示意:

    图9-14 Entry对象存储结构图.png

              Entry对象存储结构图

          然后,我们画出Entry[]数组的结构(这也是HashMap的结构):

      图9-15 Entry数组存储结构图.png

              Entry数组存储结构图

       存储数据过程put(key,value)

          明白了HashMap的基本结构后,我们继续深入学习HashMap如何存储数据。此处的核心是如何产生hash值,该值用来对应数组的存储位置。

      图9-16 HashMap存储数据过程示意图.png

                   HashMap存储数据过程示意图

          我们的目的是将”key-value两个对象”成对存放到HashMap的Entry[]数组中。参见以下步骤:

          (1) 获得key对象的hashcode

               首先调用key对象的hashcode()方法,获得hashcode。

          (2) 根据hashcode计算出hash值(要求在[0, 数组长度-1]区间)

               hashcode是一个整数,我们需要将它转化成[0, 数组长度-1]的范围。我们要求转化后的hash值尽量均匀地分布在[0,数组长度-1]这个区间,减少“hash冲突”

               i. 一种极端简单和低下的算法是:

               hash值 = hashcode/hashcode;

               也就是说,hash值总是1。意味着,键值对对象都会存储到数组索引1位置,这样就形成一个非常长的链表。相当于每存储一个对象都会发生“hash冲突”,HashMap也退化成了一个“链表”。

               ii. 一种简单和常用的算法是(相除取余算法):

               hash值 = hashcode%数组长度

               这种算法可以让hash值均匀的分布在[0,数组长度-1]的区间。 早期的HashTable就是采用这种算法。但是,这种算法由于使用了“除法”,效率低下。JDK后来改进了算法。首先约定数组长度必须为2的整数幂,这样采用位运算即可实现取余的效果:hash值 = hashcode&(数组长度-1)。

               iii. 如下为我们自己测试简单的hash算法:

      测试hash算

      

    public class Test {
        public static void main(String[] args) {
            int h = 25860399;
            int length = 16;//length为2的整数次幂,则h&(length-1)相当于对length取模
            myHash(h, length);
        }
        /**
         * @param h  任意整数
         * @param length 长度必须为2的整数幂
         * @return
         */
        public static  int myHash(int h,int length){
            System.out.println(h&(length-1));
            //length为2的整数幂情况下,和取余的值一样
            System.out.println(h%length);//取余数
            return h&(length-1);
        }
    }
    

      运行如上程序,我们就能发现直接取余(h%length)和位运算(h&(length-1))结果是一致的。事实上,为了获得更好的散列效果,JDK对hashcode进行了两次散列处理(核心目标就是为了分布更散更均匀),源码如下:

      图9-17 hash算法源码.png

                hash算法源码

          (3) 生成Entry对象

              如上所述,一个Entry对象包含4部分:key对象、value对象、hash值、指向下一个Entry对象的引用。我们现在算出了hash值。下一个Entry对象的引用为null。

          (4) 将Entry对象放到table数组中

              如果本Entry对象对应的数组索引位置还没有放Entry对象,则直接将Entry对象存储进数组;如果对应索引位置已经有Entry对象,则将已有Entry对象的next指向本Entry对象,形成链表。

      总结如上过程:

          当添加一个元素(key-value)时,首先计算key的hash值,以此确定插入数组中的位置,但是可能存在同一hash值的元素已经被放在数组同一位置了,这时就添加到同一hash值的元素的后面,他们在数组的同一位置,就形成了链表,同一个链表上的Hash值是相同的,所以说数组存放的是链表。 JDK8中,当链表长度大于8时,链表就转换为红黑树,这样又大大提高了查找的效率。

      取数据过程get(key)

          我们需要通过key对象获得“键值对”对象,进而返回value对象。明白了存储数据过程,取数据就比较简单了,参见以下步骤:

          (1) 获得key的hashcode,通过hash()散列算法得到hash值,进而定位到数组的位置。

          (2) 在链表上挨个比较key对象。 调用equals()方法,将key对象和链表上所有节点的key对象进行比较,直到碰到返回true的节点对象为止。

          (3) 返回equals()为true的节点对象的value对象。

          明白了存取数据的过程,我们再来看一下hashcode()和equals方法的关系:

          Java中规定,两个内容相同(equals()为true)的对象必须具有相等的hashCode。因为如果equals()为true而两个对象的hashcode不同;那在整个存储过程中就发生了悖论。

      扩容问题

          HashMap的位桶数组,初始大小为16。实际使用时,显然大小是可变的。如果位桶数组中的元素达到(0.75*数组 length), 就重新调整数组大小变为原来2倍大小。

          扩容很耗时。扩容的本质是定义新的更大的数组,并将旧数组内容挨个拷贝到新数组中。

      JDK8将链表在大于8情况下变为红黑二叉树

          JDK8中,HashMap在存储一个元素时,当对应链表长度大于8时,链表就转换为红黑树,这样又大大提高了查找的效率。

    2 TreeMap:TreeMap是红黑二叉树的典型实现。我们打开TreeMap的源码,发现里面有一行核心代码:

      root用来存储整个树的根节点。我们继续跟踪Entry(是TreeMap的内部类)的代码:

      

      源码可以看到里面存储了本身数据、左节点、右节点、父节点、以及节点颜色。 TreeMap的put()/remove()方法大量使用了红黑树的理论。

          TreeMap和HashMap实现了同样的接口Map,因此,用法对于调用者来说没有区别。HashMap效率高于TreeMap;在需要排序的Map时才选用TreeMap。

    Set

        特点:无序、不可重复。

      无序:指Set中的元素没有索引,我们只能遍历查找;

      不可重复:指不允许加入重复的元素。更确切地讲,新元素如果和Set中某个元素通过equals()方法对比为true,则不能加入;甚至,Set中也只能放入一个null元素,不能多个。

    1 HashSet:HashSet是采用哈希算法实现,底层实际是用HashMap实现的(HashSet本质就是一个简化版的HashMap),因此,查询效率和增删效率都比较高。我们来看一下HashSet的源码:

      

      我们发现里面有个map属性,这就是HashSet的核心秘密。我们再看add()方法,发现增加一个元素说白了就是在map中增加一个键值对,键对象就是这个元素,值对象是名为PRESENT的Object对象。说白了,就是“往set中加入元素,本质就是把这个元素作为key加入到了内部的map中”。

          由于map中key都是不可重复的,因此,Set天然具有“不可重复”的特性。

    2 TreeSet:TreeSet底层实际是用TreeMap实现的,内部维持了一个简化版的TreeMap,通过key来存储Set的元素。 TreeSet内部需要对存储的元素进行排序,因此,我们对应的类需要实现Comparable接口。这样,才能根据compareTo()方法比较对象之间的大小,才能进行内部排序。

  • 相关阅读:
    Git入门
    基于sendmail的简单zabbix邮件报警
    zabbix agentd安装
    我整理的一份来自于线上的Nginx配置(Nginx.conf),希望对学习Nginx的有帮助
    【转载】Spring Boot引起的“堆外内存泄漏”排查及经验总结
    lodop+art-template实现web端漂亮的小票样式打印
    《阿里巴巴Java开发手册》改名《Java开发手册》,涵盖史无前例的三大升级
    Spring Boot的学习之路(02):和你一起阅读Spring Boot官网
    Spring Boot的学习之路(01):缘起
    『 效率工具 』Spring Boot版的轻量级代码生成器,减少70%以上的开发任务
  • 原文地址:https://www.cnblogs.com/Tony100/p/11377661.html
Copyright © 2011-2022 走看看