zoukankan      html  css  js  c++  java
  • 哈夫曼树

    哈夫曼树

    重点:构造哈夫曼树

    带权路径长度

    结点的:有某种现实含义的数值(如:表示节点的重要性等)

    结点的带权路径长度:从树的根到该结点的路径长度(经过的边数)与该节点上权值的乘积。

    树的带权路径长度:树中所有叶节点的带权路径长度之和(WPL,Weighted Path Length)

    [WPL=sum_{i=1}^nw_il_i ]

    哈夫曼树:(最优二叉树) 在含有n个带权叶节点的二叉树中,其中带权路径长度(WPL)最小的二叉树称为哈夫曼树,也称最优二叉树。

    哈夫曼树的构造

    每次先选择集合当中最小的两个,让它们成为兄弟。

    两个树结合权值之和做为新根节点的权值。

    n个结点,总共需要合并n-1次

    每次合并都会增加多一个结点

    [WPL_{min}=1*7+2*3+3*2+4*1+4*2=31 ]

    1. 每个初始结点最终都会成为叶节点,且权值越小的结点到根节点的路径长度越大。
    2. 哈弗曼树的结点总数为2n-1
    3. 哈夫曼树中不存在度为1的结点
    4. 哈夫曼树并不唯一,但WPL必然相同且为最优

    哈夫曼编码

    前缀编码:没有一个编码是另一个编码的前缀

    哈夫曼编码可以用于数据的压缩

  • 相关阅读:
    理解MapReduce计算构架
    熟悉HBase基本操作
    爬虫大作业
    第三章 熟悉常用的HDFS操作
    数据结构化与保存
    使用正则表达式,取得点击次数,函数抽离
    爬取校园新闻首页的新闻
    网络爬虫基础练习
    Hadoop综合大作业
    hive基本操作与应用
  • 原文地址:https://www.cnblogs.com/jev-0987/p/13207565.html
Copyright © 2011-2022 走看看