zoukankan      html  css  js  c++  java
  • 赫夫曼哈夫曼霍夫曼编码 (Huffman Tree)

    哈夫曼树
    给定n个权值作为n的叶子结点,构造一棵二叉树,若带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。

    哈夫曼编码(Huffman Coding)

    又称霍夫曼编码,是一种编码方式,哈夫曼编码是可变字长编码(VLC)的一种。Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长度最短的码字,有时称之为最佳编码,一般就叫做Huffman编码(有时也称为霍夫曼编码)。

    应用举例

    哈夫曼树─即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。 在计算机信息处理中,“哈夫曼编码”是一种一致性编码法(又称“熵编码法”),用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。

    构造Huffman tree

    过程:

    1、输入字符关键字以及对应的频率。

    2、根据关键字的频率构造最优二叉树

      (1)借助于STL的优先队列 :priority_queue<type, vector<type>,cmp>que; 其中type为优先队列的类型,比如说int, double, 也可以将结构体作为类型。vector它是一个多功能的,能够操作多种数据结构和算法的模板类和函数库。借助于vector可以很轻松的解决一些问题。cmp为定义的优先队列的出队规则,给出博客http://www.cnblogs.com/buptLizer/archive/2011/09/11/2173708.html大家可以参考来理解优先队列的使用。以及其中常用的操作que.pop(), que.push(), que.top(), que.size()等...

      (2)构造最优二叉搜索树:在有了最优二叉搜索树的帮助之后,对于构建搜索树很容易。上面的图很清楚的讲解了构造的过程,每次取出频率最小的两个形成一个子树,将其频率相加之后再放入优先队列之中,直到队列中元素个数为0。在操作过程中需要遵守最优二叉搜索树的定义,左孩子小于父节点,右孩子大于父节点。

      (3)递归遍历二叉树:遍历中只需要记住,向左遍历那么前缀码为0,向右为1.

    亲测代码:

     1 #include <bits/stdc++.h>
     2 #define max_size 10010
     3 char c[max_size];
     4 double f[max_size];
     5 
     6 using namespace std;
     7 typedef struct node
     8 {
     9     char ch;
    10     double freq;
    11     node *lchild;
    12     node *rchild;
    13     node(char c=0,double f=0,node *l=NULL,node *r=NULL):
    14         ch(c),freq(f),lchild(l),rchild(r) {}
    15 };
    16 typedef struct cmp
    17 {
    18     bool operator()(node*&a,node*&b)
    19     {
    20         return a->freq>b->freq;
    21     }
    22 };
    23 node* createTree(int n)
    24 {
    25     priority_queue<node*,vector<node*>,cmp>que;
    26     for(int i=1; i<=n; i++)
    27     {
    28         cin>>c[i]>>f[i];
    29         que.push(new node(c[i],f[i]));
    30     }
    31     while(que.size()>1)
    32     {
    33         node *l=que.top();
    34         que.pop();
    35         node *r=que.top();
    36         que.pop();
    37         node *newnode=new node(0,l->freq+r->freq,l,r);
    38         que.push(newnode);
    39     }
    40     return que.top();
    41 }
    42 
    43 void printInfo(const node *tree,string code)
    44 {
    45     if(tree->lchild==NULL&&tree->rchild==NULL)
    46     {
    47         cout<<tree->ch<<":"<<code<<"  ";
    48         return;
    49     }
    50     if(tree->lchild!=NULL)printInfo(tree->lchild,code+'0');
    51     if(tree->rchild!=NULL)printInfo(tree->rchild,code+'1');
    52 }
    53 void deleteTree(node *tree)
    54 {
    55     if(tree->lchild!=NULL)deleteTree(tree->lchild);
    56     if(tree->rchild!=NULL)deleteTree(tree->rchild);
    57     delete(tree);
    58 }
    59 int main()
    60 {
    61     int n;
    62     priority_queue<node*,vector<node*>,greater<node*> >que;
    63     while(~scanf("%d",&n))
    64     {
    65         node *tree=createTree(n);
    66         printf("Huffman code:
    ");
    67         printInfo(tree,"");
    68     }
    69 }
    View Code

    输入数据以及运行结果:

  • 相关阅读:
    C#2008与.NET 3.5 高级程序设计读书笔记(6)继承和多态
    C#2008与.NET 3.5 高级程序设计读书笔记(5)定义封装的类类型
    C#2008与.NET 3.5 高级程序设计读书笔记(10) 集合与泛型
    C#2008与.NET 3.5 高级程序设计读书笔记(8)对象的生命周期
    Jquery1.4.1 学习
    JavaScript高级程序设计(第2版) 之 JavaScript的传值方式
    解密宝典——十招教你学会软件破解(转载收藏)
    使用sql server中的全文索引( 转 )
    JavaScript高级程序设计(第2版) 之 JavaScript变量作用域
    .NET读取Excel数据为null的解决办法
  • 原文地址:https://www.cnblogs.com/zpfbuaa/p/4957691.html
Copyright © 2011-2022 走看看