哈夫曼树处理这样的一种问题:
给出一棵n个叶子的k叉树,每个叶子有一个权值wi,要求最小化∑wi*di
di表示,第i个叶子节点到根节点的距离。(一般是边数)
处理方法比较固定。
贪心的思路:我们让权值较大的叶子节点 的深度越小越好。
建立一个小根堆。
1.插入n个叶子的权值。
2.每次取出最小的k个,ans+=这些权值和。
3.合并出一个父亲节点,权值就是这k个点的权值和。(通常这一步不用真正实现,只是助于理解)
4.把这个新的父亲节点权值放进小根堆里面。
5.重复2~4操作,直到堆中只有一个节点(就是根节点)
但是这样是有问题的。
发现,我们每取出一次,合并一次,就是相当于把取出来的这些叶子深度+1,
最后一次合并的所有节点,就是根节点的儿子,他们的深度最浅。就是1
而可能出现,最后一次,堆中有2~k-1个节点,不能使最浅的一层放满。
这样肯定是不优的,因为我们可以把较深的一个节点放在根节点的儿子位置上。(因为这一层还没有放满)使得答案更优。
我们这样处理这个问题:
往堆里面不断加入权值为0的及节点。直到满足(tot-1)%(k-1)==0 tot是初始堆中节点个数。
这样,每次都可以恰好取出k个,并且0值的点会先取出来,相当于这里是空位,他们不会影响最后的值。
并且,这样保证了最浅的一层尽可能的放满,就一定是最优解了。
相当于把空位留给了更深的 位置。
例题:
1.合并果子
Description:
n堆果子,合并两堆果子,花费两堆果子的重量之和的力气。问合成一堆最少用多少力气?
Solution:
浅显的解释就是贪心了,因为要合并固定的n-1次,必然每次选择最小的两个合并。
本质上其实是一棵n节点的2叉哈夫曼树。叶子节点的深度米就是这个原始堆被合并的次数。
2.荷马史诗
Description:
Solution:
我们利用tire树的结构来考虑,为了保证没有前缀包含关系,最后建出的trie必然是有n个叶子节点。
每个叶子节点到根节点的路径长度就是单词长度,并且这个长度要乘上出现的次数wi
恰好就是Huffman的模型!!
一切就很裸了。
但是还要求一个最长的单词最短,,
那么,就在权值相同的节点中,选择之前已经合并过的次数最小的点合并,也就是那些当前深度最浅的点。
这样,把深度“平均”了一下,就是最优的情况了。
另外,新合并出来的点的合并次数,即深度,就是最大的所选点的合并次数。
代码:
#include<bits/stdc++.h> using namespace std; typedef long long ll; const int N=100000+10; int n,k,tot; ll w[N]; ll ans,mx; struct node{ ll val,mer; bool friend operator <(node a,node b){ if(a.val==b.val) return a.mer>b.mer; return a.val>b.val; } }; priority_queue<node>q; int main() { scanf("%d%d",&n,&k); for(int i=1;i<=n;i++){ scanf("%lld",&w[i]); node nn;nn.val=w[i],nn.mer=0; q.push(nn); } tot=n; while((tot-1)%(k-1)){ node nn;nn.val=0;nn.mer=0; q.push(nn);tot++; } while(q.size()>1){ ll sum=0; ll big=0; for(int i=1;i<=k;i++){ node bb=q.top();q.pop(); sum+=bb.val; big=max(big,bb.mer); } mx=max(mx,big+1); ans+=sum; node kk;kk.val=sum;kk.mer=big+1; q.push(kk); } printf("%lld %lld",ans,mx); return 0; }