zoukankan      html  css  js  c++  java
  • 二叉堆(一)之 图文解析 和 C语言的实现

    概要

    本章介绍二叉堆,二叉堆就是通常我们所说的数据结构中"堆"中的一种。和以往一样,本文会先对二叉堆的理论知识进行简单介绍,然后给出C语言的实现。后续再分别给出C++和Java版本的实现;实现的语言虽不同,但是原理如出一辙,选择其中之一进行了解即可。若文章有错误或不足的地方,请不吝指出!

    目录
    1. 堆和二叉堆的介绍
    2. 二叉堆的图文解析
    3. 二叉堆的C实现(完整源码)
    4. 二叉堆的C测试程序

    转载请注明出处:http://www.cnblogs.com/skywang12345/p/3610187.html


    更多内容:数据结构与算法系列 目录

    (01) 二叉堆(一)之 图文解析 和 C语言的实现
    (02) 二叉堆(二)之 C++的实现
    (03) 二叉堆(三)之 Java的实

    堆和二叉堆的介绍

    堆的定义

    堆(heap),这里所说的堆是数据结构中的堆,而不是内存模型中的堆。堆通常是一个可以被看做一棵树,它满足下列性质:
    [性质一] 堆中任意节点的值总是不大于(不小于)其子节点的值;
    [性质二] 堆总是一棵完全树。
    将任意节点不大于其子节点的堆叫做最小堆小根堆,而将任意节点不小于其子节点的堆叫做最大堆大根堆。常见的堆有二叉堆、左倾堆、斜堆、二项堆、斐波那契堆等等。

    二叉堆的定义

    二叉堆是完全二元树或者是近似完全二元树,它分为两种:最大堆最小堆
    最大堆:父结点的键值总是大于或等于任何一个子节点的键值;最小堆:父结点的键值总是小于或等于任何一个子节点的键值。示意图如下:

    二叉堆一般都通过"数组"来实现。数组实现的二叉堆,父节点和子节点的位置存在一定的关系。有时候,我们将"二叉堆的第一个元素"放在数组索引0的位置,有时候放在1的位置。当然,它们的本质一样(都是二叉堆),只是实现上稍微有一丁点区别。
    假设"第一个元素"在数组中的索引为 0 的话,则父节点和子节点的位置关系如下:
    (01) 索引为i的左孩子的索引是 (2*i+1);
    (02) 索引为i的左孩子的索引是 (2*i+2);
    (03) 索引为i的父结点的索引是 floor((i-1)/2);

    假设"第一个元素"在数组中的索引为 1 的话,则父节点和子节点的位置关系如下:
    (01) 索引为i的左孩子的索引是 (2*i);
    (02) 索引为i的左孩子的索引是 (2*i+1);
    (03) 索引为i的父结点的索引是 floor(i/2);

    注意:本文二叉堆的实现统统都是采用"二叉堆第一个元素在数组索引为0"的方式!

    二叉堆的图文解析

    在前面,我们已经了解到:"最大堆"和"最小堆"是对称关系。这也意味着,了解其中之一即可。本节的图文解析是以"最大堆"来进行介绍的。

    二叉堆的核心是"添加节点"和"删除节点",理解这两个算法,二叉堆也就基本掌握了。下面对它们进行介绍。

    1. 添加

    假设在最大堆[90,80,70,60,40,30,20,10,50]种添加85,需要执行的步骤如下:

    如上图所示,当向最大堆中添加数据时:先将数据加入到最大堆的最后,然后尽可能把这个元素往上挪,直到挪不动为止!
    将85添加到[90,80,70,60,40,30,20,10,50]中后,最大堆变成了[90,85,70,60,80,30,20,10,50,40]。

    最大堆的插入代码(C语言)

    /*
     * 最大堆的向上调整算法(从start开始向上直到0,调整堆)
     *
     * 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
     *
     * 参数说明:
     *     start -- 被上调节点的起始位置(一般为数组中最后一个元素的索引)
     */
    static void maxheap_filterup(int start)
    {
        int c = start;            // 当前节点(current)的位置
        int p = (c-1)/2;        // 父(parent)结点的位置 
        int tmp = m_heap[c];        // 当前节点(current)的大小
    
        while(c > 0)
        {
            if(m_heap[p] >= tmp)
                break;
            else
            {
                m_heap[c] = m_heap[p];
                c = p;
                p = (p-1)/2;   
            }       
        }
        m_heap[c] = tmp;
    }
      
    /* 
     * 将data插入到二叉堆中
     *
     * 返回值:
     *     0,表示成功
     *    -1,表示失败
     */
    int maxheap_insert(int data)
    {
        // 如果"堆"已满,则返回
        if(m_size == m_capacity)
            return -1;
     
        m_heap[m_size] = data;        // 将"数组"插在表尾
        maxheap_filterup(m_size);    // 向上调整堆
        m_size++;                    // 堆的实际容量+1
    
        return 0;
    }

    maxheap_insert(data)的作用:将数据data添加到最大堆中。
    当堆已满的时候,添加失败;否则data添加到最大堆的末尾。然后通过上调算法重新调整数组,使之重新成为最大堆。

    2. 删除

    假设从最大堆[90,85,70,60,80,30,20,10,50,40]中删除90,需要执行的步骤如下:

    从[90,85,70,60,80,30,20,10,50,40]删除90之后,最大堆变成了[85,80,70,60,40,30,20,10,50]。
    如上图所示,当从最大堆中删除数据时:先删除该数据,然后用最大堆中最后一个的元素插入这个空位;接着,把这个“空位”尽量往上挪,直到剩余的数据变成一个最大堆。

    注意:考虑从最大堆[90,85,70,60,80,30,20,10,50,40]中删除60,执行的步骤不能单纯的用它的子节点来替换;而必须考虑到"替换后的树仍然要是最大堆"!

    最大堆的删除代码(C语言)

    /* 
     * 返回data在二叉堆中的索引
     *
     * 返回值:
     *     存在 -- 返回data在数组中的索引
     *     不存在 -- -1
     */
    int get_index(int data)
    {
        int i=0;
    
        for(i=0; i<m_size; i++)
            if (data==m_heap[i])
                return i;
    
        return -1;
    }
    
    /* 
     * 最大堆的向下调整算法
     *
     * 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
     *
     * 参数说明:
     *     start -- 被下调节点的起始位置(一般为0,表示从第1个开始)
     *     end   -- 截至范围(一般为数组中最后一个元素的索引)
     */
    static void maxheap_filterdown(int start, int end)
    {
        int c = start;          // 当前(current)节点的位置
        int l = 2*c + 1;     // 左(left)孩子的位置
        int tmp = m_heap[c];    // 当前(current)节点的大小
    
        while(l <= end)
        {
            // "l"是左孩子,"l+1"是右孩子
            if(l < end && m_heap[l] < m_heap[l+1])
                l++;        // 左右两孩子中选择较大者,即m_heap[l+1]
            if(tmp >= m_heap[l])
                break;        //调整结束
            else
            {
                m_heap[c] = m_heap[l];
                c = l;
                l = 2*l + 1;   
            }       
        }   
        m_heap[c] = tmp;
    }
    
    /*
     * 删除最大堆中的data
     *
     * 返回值:
     *      0,成功
     *     -1,失败
     */
    int maxheap_remove(int data)
    {
        int index;
        // 如果"堆"已空,则返回-1
        if(m_size == 0)
            return -1;
    
        // 获取data在数组中的索引
        index = get_index(data); 
        if (index==-1)
            return -1;
    
        m_heap[index] = m_heap[--m_size];        // 用最后元素填补
        maxheap_filterdown(index, m_size-1);    // 从index位置开始自上向下调整为最大堆
    
        return 0;
    }

    maxheap_remove(data)的作用:从最大堆中删除数据data。
    当堆已经为空的时候,删除失败;否则查处data在最大堆数组中的位置。找到之后,先用最后的元素来替换被删除元素;然后通过下调算法重新调整数组,使之重新成为最大堆。

    该"示例的完整代码"以及"最小堆的相关代码",请参考下面的二叉堆的实现。

     

    二叉堆的C实现(完整源码)

    二叉堆的实现同时包含了"最大堆"和"最小堆",它们是对称关系;理解一个,另一个就非常容易懂了。

    二叉堆(最大堆)的实现文件(max_heap.c)

      1 /**
      2  * 二叉堆(最大堆)
      3  *
      4  * @author skywang
      5  * @date 2014/03/07
      6  */
      7 
      8 #include <stdio.h>
      9 #include <stdlib.h>
     10 
     11 #define LENGTH(a) ( (sizeof(a)) / (sizeof(a[0])) )
     12 
     13 static int m_heap[30];        // 数据
     14 static int m_capacity=30;    // 总的容量
     15 static int m_size=0;        // 实际容量(初始化为0)
     16  
     17 /* 
     18  * 返回data在二叉堆中的索引
     19  *
     20  * 返回值:
     21  *     存在 -- 返回data在数组中的索引
     22  *     不存在 -- -1
     23  */
     24 int get_index(int data)
     25 {
     26     int i=0;
     27 
     28     for(i=0; i<m_size; i++)
     29         if (data==m_heap[i])
     30             return i;
     31 
     32     return -1;
     33 }
     34 
     35 /* 
     36  * 最大堆的向下调整算法
     37  *
     38  * 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
     39  *
     40  * 参数说明:
     41  *     start -- 被下调节点的起始位置(一般为0,表示从第1个开始)
     42  *     end   -- 截至范围(一般为数组中最后一个元素的索引)
     43  */
     44 static void maxheap_filterdown(int start, int end)
     45 {
     46     int c = start;          // 当前(current)节点的位置
     47     int l = 2*c + 1;     // 左(left)孩子的位置
     48     int tmp = m_heap[c];    // 当前(current)节点的大小
     49 
     50     while(l <= end)
     51     {
     52         // "l"是左孩子,"l+1"是右孩子
     53         if(l < end && m_heap[l] < m_heap[l+1])
     54             l++;        // 左右两孩子中选择较大者,即m_heap[l+1]
     55         if(tmp >= m_heap[l])
     56             break;        //调整结束
     57         else
     58         {
     59             m_heap[c] = m_heap[l];
     60             c = l;
     61             l = 2*l + 1;   
     62         }       
     63     }   
     64     m_heap[c] = tmp;
     65 }
     66 
     67 /*
     68  * 删除最大堆中的data
     69  *
     70  * 返回值:
     71  *      0,成功
     72  *     -1,失败
     73  */
     74 int maxheap_remove(int data)
     75 {
     76     int index;
     77     // 如果"堆"已空,则返回-1
     78     if(m_size == 0)
     79         return -1;
     80 
     81     // 获取data在数组中的索引
     82     index = get_index(data); 
     83     if (index==-1)
     84         return -1;
     85 
     86     m_heap[index] = m_heap[--m_size];        // 用最后元素填补
     87     maxheap_filterdown(index, m_size-1);    // 从index位置开始自上向下调整为最大堆
     88 
     89     return 0;
     90 }
     91 
     92 /*
     93  * 最大堆的向上调整算法(从start开始向上直到0,调整堆)
     94  *
     95  * 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
     96  *
     97  * 参数说明:
     98  *     start -- 被上调节点的起始位置(一般为数组中最后一个元素的索引)
     99  */
    100 static void maxheap_filterup(int start)
    101 {
    102     int c = start;            // 当前节点(current)的位置
    103     int p = (c-1)/2;        // 父(parent)结点的位置 
    104     int tmp = m_heap[c];        // 当前节点(current)的大小
    105 
    106     while(c > 0)
    107     {
    108         if(m_heap[p] >= tmp)
    109             break;
    110         else
    111         {
    112             m_heap[c] = m_heap[p];
    113             c = p;
    114             p = (p-1)/2;   
    115         }       
    116     }
    117     m_heap[c] = tmp;
    118 }
    119   
    120 /* 
    121  * 将data插入到二叉堆中
    122  *
    123  * 返回值:
    124  *     0,表示成功
    125  *    -1,表示失败
    126  */
    127 int maxheap_insert(int data)
    128 {
    129     // 如果"堆"已满,则返回
    130     if(m_size == m_capacity)
    131         return -1;
    132  
    133     m_heap[m_size] = data;        // 将"数组"插在表尾
    134     maxheap_filterup(m_size);    // 向上调整堆
    135     m_size++;                    // 堆的实际容量+1
    136 
    137     return 0;
    138 }
    139   
    140 /* 
    141  * 打印二叉堆
    142  *
    143  * 返回值:
    144  *     0,表示成功
    145  *    -1,表示失败
    146  */
    147 void maxheap_print()
    148 {
    149     int i;
    150     for (i=0; i<m_size; i++)
    151         printf("%d ", m_heap[i]);
    152 }
    153     
    154 void main()
    155 {
    156     int a[] = {10, 40, 30, 60, 90, 70, 20, 50, 80};
    157     int i, len=LENGTH(a);
    158 
    159     printf("== 依次添加: ");
    160     for(i=0; i<len; i++)
    161     {
    162         printf("%d ", a[i]);
    163         maxheap_insert(a[i]);
    164     }
    165 
    166     printf("
    == 最 大 堆: ");
    167     maxheap_print();
    168 
    169     i=85;
    170     maxheap_insert(i);
    171     printf("
    == 添加元素: %d", i);
    172     printf("
    == 最 大 堆: ");
    173     maxheap_print();
    174 
    175     i=90;
    176     maxheap_remove(i);
    177     printf("
    == 删除元素: %d", i);
    178     printf("
    == 最 大 堆: ");
    179     maxheap_print();
    180     printf("
    ");
    181 }
    View Code

    二叉堆(最小堆)的实现文件(min_heap.c)

      1 /**
      2  * 二叉堆(最小堆)
      3  *
      4  * @author skywang
      5  * @date 2014/03/07
      6  */
      7 
      8 #include <stdio.h>
      9 #include <stdlib.h>
     10 
     11 #define LENGTH(a) ( (sizeof(a)) / (sizeof(a[0])) )
     12 
     13 static int m_heap[30];
     14 static int m_capacity=30;    // 总的容量
     15 static int m_size=0;        // 实际容量(初始化为0)
     16  
     17 /* 
     18  * 返回data在二叉堆中的索引
     19  *
     20  * 返回值:
     21  *     存在 -- 返回data在数组中的索引
     22  *     不存在 -- -1
     23  */
     24 int get_index(int data)
     25 {
     26     int i=0;
     27 
     28     for(i=0; i<m_size; i++)
     29         if (data==m_heap[i])
     30             return i;
     31 
     32     return -1;
     33 }
     34 
     35 /* 
     36  * 最小堆的向下调整算法
     37  *
     38  * 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
     39  *
     40  * 参数说明:
     41  *     start -- 被下调节点的起始位置(一般为0,表示从第1个开始)
     42  *     end   -- 截至范围(一般为数组中最后一个元素的索引)
     43  */
     44 static void minheap_filterdown(int start, int end)
     45 {
     46     int c = start;          // 当前(current)节点的位置
     47     int l = 2*c + 1;     // 左(left)孩子的位置
     48     int tmp = m_heap[c];    // 当前(current)节点的大小
     49 
     50     while(l <= end)
     51     {
     52         // "l"是左孩子,"l+1"是右孩子
     53         if(l < end && m_heap[l] > m_heap[l+1])
     54             l++;        // 左右两孩子中选择较小者,即m_heap[l+1]
     55         if(tmp <= m_heap[l])
     56             break;        //调整结束
     57         else
     58         {
     59             m_heap[c] = m_heap[l];
     60             c = l;
     61             l = 2*l + 1;   
     62         }       
     63     }   
     64     m_heap[c] = tmp;
     65 }
     66  
     67 /*
     68  * 删除最小堆中的data
     69  *
     70  * 返回值:
     71  *      0,成功
     72  *     -1,失败
     73  */
     74 int minheap_remove(int data)
     75 {
     76     int index;
     77     // 如果"堆"已空,则返回-1
     78     if(m_size == 0)
     79         return -1;
     80 
     81     // 获取data在数组中的索引
     82     index = get_index(data); 
     83     if (index==-1)
     84         return -1;
     85 
     86     m_heap[index] = m_heap[--m_size];        // 用最后元素填补
     87     minheap_filterdown(index, m_size-1);    // 从index号位置开始自上向下调整为最小堆
     88 
     89     return 0;
     90 }
     91 
     92 /*
     93  * 最小堆的向上调整算法(从start开始向上直到0,调整堆)
     94  *
     95  * 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
     96  *
     97  * 参数说明:
     98  *     start -- 被上调节点的起始位置(一般为数组中最后一个元素的索引)
     99  */
    100 static void filter_up(int start)
    101 {
    102     int c = start;            // 当前节点(current)的位置
    103     int p = (c-1)/2;        // 父(parent)结点的位置 
    104     int tmp = m_heap[c];        // 当前节点(current)的大小
    105 
    106     while(c > 0)
    107     {
    108         if(m_heap[p] <= tmp)
    109             break;
    110         else
    111         {
    112             m_heap[c] = m_heap[p];
    113             c = p;
    114             p = (p-1)/2;   
    115         }       
    116     }
    117     m_heap[c] = tmp;
    118 }
    119   
    120 /* 
    121  * 将data插入到二叉堆中
    122  *
    123  * 返回值:
    124  *     0,表示成功
    125  *    -1,表示失败
    126  */
    127 int minheap_insert(int data)
    128 {
    129     // 如果"堆"已满,则返回
    130     if(m_size == m_capacity)
    131         return -1;
    132  
    133     m_heap[m_size] = data;        // 将"数组"插在表尾
    134     filter_up(m_size);            // 向上调整堆
    135     m_size++;                    // 堆的实际容量+1
    136 
    137     return 0;
    138 }
    139   
    140 /* 
    141  * 打印二叉堆
    142  *
    143  * 返回值:
    144  *     0,表示成功
    145  *    -1,表示失败
    146  */
    147 void minheap_print()
    148 {
    149     int i;
    150     for (i=0; i<m_size; i++)
    151         printf("%d ", m_heap[i]);
    152 }
    153 
    154 void main()
    155 {
    156     int a[] = {80, 40, 30, 60, 90, 70, 10, 50, 20};
    157     int i, len=LENGTH(a);
    158 
    159     printf("== 依次添加: ");
    160     for(i=0; i<len; i++)
    161     {
    162         printf("%d ", a[i]);
    163         minheap_insert(a[i]);
    164     }
    165 
    166     printf("
    == 最 小 堆: ");
    167     minheap_print();
    168 
    169     i=15;
    170     minheap_insert(i);
    171     printf("
    == 添加元素: %d", i);
    172     printf("
    == 最 小 堆: ");
    173     minheap_print();
    174 
    175     i=10;
    176     minheap_remove(i);
    177     printf("
    == 删除元素: %d", i);
    178     printf("
    == 最 小 堆: ");
    179     minheap_print();
    180     printf("
    ");
    181 }
    View Code

    二叉堆的C测试程序

    测试程序已经包含在相应的实现文件中了,这里就不再重复说明了。

    最大堆(max_heap.c)的运行结果:

    == 依次添加: 10 40 30 60 90 70 20 50 80 
    == 最 大 堆: 90 80 70 60 40 30 20 10 50 
    == 添加元素: 85
    == 最 大 堆: 90 85 70 60 80 30 20 10 50 40 
    == 删除元素: 90
    == 最 大 堆: 85 80 70 60 40 30 20 10 50 

    最小堆(min_heap.c)的运行结果:

    == 依次添加: 80 40 30 60 90 70 10 50 20 
    == 最 小 堆: 10 20 30 50 90 70 40 80 60 
    == 添加元素: 15
    == 最 小 堆: 10 15 30 50 20 70 40 80 60 90 
    == 删除元素: 10
    == 最 小 堆: 15 20 30 50 90 70 40 80 60 

    PS. 二叉堆是"堆排序"的理论基石。以后讲解算法时会讲解到"堆排序",理解了"二叉堆"之后,"堆排序"就很简单了。

  • 相关阅读:
    [牛客]十二桥问题 解题报告
    [NOIP2017 逛公园] 解题报告
    [JSOI2008]最小生成树计数 解题报告
    类欧几里得算法
    概率与期望题目列表
    [SCOI2008]配对 解题报告
    拦截导弹
    牛客网-约数的个数
    牛客网-成绩排名
    最大连续区间和的算法总结
  • 原文地址:https://www.cnblogs.com/skywang12345/p/3610187.html
Copyright © 2011-2022 走看看