贪心算法与集合覆盖
应用场景-集合覆盖问题
假设存在下面需要付费的广播台,以及广播台信号可以覆盖的地区。 如何选择最少的广播台,让所有的地区都可以接收到信号
广播台 |
覆盖地区 |
K1 |
"北京", "上海", "天津" |
K2 |
"广州", "北京", "深圳" |
K3 |
"成都", "上海", "杭州" |
K4 |
"上海", "天津" |
K5 |
"杭州", "大连" |
贪心算法介绍
- 贪婪算法(贪心算法)是指在对问题进行求解时,在每一步选择中都采取最好或者最优(即最有利)的选择,从而希望能够导致结果是最好或者最优的算法
- 贪婪算法所得到的结果不一定是最优的结果(有时候会是最优解) [这么想 满足你的要求了,电台最少 可能花费不是最少 优有很多方面 可能满足了这个 满足不了那个],但是都是相对近似(接近)最优解的结果
贪心算法问题
应用场景-集合覆盖问题
- 假设存在如下表的需要付费的广播台,以及广播台信号可以覆盖的地区。 如何选择最少的广播台,让所有的地区都可以接收到信号
广播台 |
覆盖地区 |
K1 |
"北京", "上海", "天津" |
K2 |
"广州", "北京", "深圳" |
K3 |
"成都", "上海", "杭州" |
K4 |
"上海", "天津" |
K5 |
"杭州", "大连" |
- 思路分析:
- 如何找出覆盖所有地区的广播台的集合呢,使用穷举法实现,列出每个可能的广播台的集合,这被称为幂集。假设总的有n个广播台,则广播台的组合总共有
2ⁿ -1 个,假设每秒可以计算10个子集, 如图:
广播台数量n |
子集总数2ⁿ |
需要的时间 |
5 |
32 |
3.2秒 |
10 |
1024 |
102.4秒 |
32 |
4294967296 |
13.6年 |
100 |
1.26*100³º |
4x10²³年 |
使用穷举法 在这种组合的情况下效率很低,不推荐使用
3)步骤
- 使用贪婪算法,效率高:
目前并没有算法可以快速计算得到准备的值, 使用贪婪算法,则可以得到非常接近的解,并且效率高。选择策略上,因为需要覆盖全部地区的最小集合:
数据结构164用图画的形式 实现了这下面的步骤 比文字生动一些 更容易理解是什么意思
- 遍历所有的广播电台, 找到一个覆盖了最多未覆盖的地区的电台(此电台可能包含一些已覆盖的地区,但没有关系)
- 将这个电台加入到一个集合中(比如ArrayList), 想办法把该电台覆盖的地区在下次比较时去掉。
- 重复第1步直到覆盖了全部的地区
图解集合覆盖分析 演化过程1 开始遍历 算出每个电台 可以覆盖未覆盖地区的数量
图解集合覆盖分析 演化过程2 绿色的已经循环一遍 获得了每个电台未覆盖区域数目 且maxkey已经指向k1
图解集合覆盖分析 演化过程2 已经选出可以覆盖所有地区的电台
4).贪心算法注意事项和细节
- 贪婪算法所得到的结果不一定是最优的结果(有时候会是最优解),但是都是相对近似(接近)最优解的结果
- 比如上题的算法选出的是K1, K2, K3, K5,符合覆盖了全部的地区
- 但是我们发现 K2, K3,K4,K5 也可以覆盖全部地区,如果K2 的使用成本低于K1,那么我们上题的 K1, K2, K3, K5 虽然是满足条件,但是并不是最优的. 所以 最优是指什么都最好的
核心代码
while(allAreas.size() != 0) { // 如果allAreas 不为0, 则表示还没有覆盖到所有的地区 //每进行一次while(每次把maxkey电台放入selects后),需要清空maxkey电台中的地区 maxKey = null; //遍历 broadcasts, 取出对应key 这个for是用来找到最优的maxkey的 for(String key : broadcasts.keySet()) {//这里获得的key 应该是k1 k2这种 //每进行一次for(每次往temp临时集合中存完数据 下次再使用前要把临时集合中的数据清空) tempSet.clear(); //当前这个key能够覆盖的地区 把地区放到areas中 HashSet<String> areas = broadcasts.get(key);//这个方法是通过key 取value 也就是地区 tempSet.addAll(areas); //把地区放到tempset中 //求出tempSet 和 allAreas 集合的交集, 交集会赋给 tempSet tempSet.retainAll(allAreas); //如果当前这个集合包含的未覆盖地区的数量,比maxKey指向的集合地区还多 //就需要重置maxKey 意思就是把地区最多的电台赋给maxkey // tempSet.size() >broadcasts.get(maxKey).size()) 体现出贪心算法的特点,每次都选择最优的 //(tempSet.size() > 0 说明还未覆盖完所有地区 因为是和 allAreas还有交集 if(tempSet.size() > 0 && (maxKey == null || tempSet.size() >broadcasts.get(maxKey).size())){ maxKey = key; } } //maxKey != null, 就应该将maxKey 加入selects if(maxKey != null) { selects.add(maxKey); //将maxKey指向的广播电台覆盖的地区,从 allAreas 去掉 allAreas.removeAll(broadcasts.get(maxKey)); } }
集合覆盖全部代码
package com.atguigu.greedy; import java.util.ArrayList; import java.util.HashMap; import java.util.HashSet; public class GreedyAlgorithm { public static void main(String[] args) { //创建广播电台,放入到Map HashMap<String,HashSet<String>> broadcasts = new HashMap<String, HashSet<String>>(); //将各个电台放入到broadcasts HashSet<String> hashSet1 = new HashSet<String>(); hashSet1.add("北京"); hashSet1.add("上海"); hashSet1.add("天津"); HashSet<String> hashSet2 = new HashSet<String>(); hashSet2.add("广州"); hashSet2.add("北京"); hashSet2.add("深圳"); HashSet<String> hashSet3 = new HashSet<String>(); hashSet3.add("成都"); hashSet3.add("上海"); hashSet3.add("杭州"); HashSet<String> hashSet4 = new HashSet<String>(); hashSet4.add("上海"); hashSet4.add("天津"); HashSet<String> hashSet5 = new HashSet<String>(); hashSet5.add("杭州"); hashSet5.add("大连"); //加入到map broadcasts.put("K1", hashSet1); broadcasts.put("K2", hashSet2); broadcasts.put("K3", hashSet3); broadcasts.put("K4", hashSet4); broadcasts.put("K5", hashSet5); //allAreas 存放所有的地区 HashSet<String> allAreas = new HashSet<String>(); allAreas.add("北京"); allAreas.add("上海"); allAreas.add("天津"); allAreas.add("广州"); allAreas.add("深圳"); allAreas.add("成都"); allAreas.add("杭州"); allAreas.add("大连"); //创建ArrayList, 存放选择的电台集合 ArrayList<String> selects = new ArrayList<String>(); //定义一个临时的集合, 在遍历的过程中,存放遍历过程中的电台覆盖的地区和当前还没有覆盖的地区的交集 HashSet<String> tempSet = new HashSet<String>(); //定义给maxKey , 保存在一次遍历过程中,能够覆盖最大未覆盖的地区对应的电台的key //如果maxKey 不为null , 则会加入到 selects String maxKey = null; while(allAreas.size() != 0) { // 如果allAreas 不为0, 则表示还没有覆盖到所有的地区 //每进行一次while(每次把maxkey电台放入selects后),需要清空maxkey电台中的地区 maxKey = null; //遍历 broadcasts, 取出对应key 这个for是用来找到最优的maxkey的 for(String key : broadcasts.keySet()) {//这里获得的key 应该是k1 k2 //每进行一次for(每次往temp临时集合中存完数据 下次再使用前要把临时集合中的数据清空) tempSet.clear(); //当前这个key能够覆盖的地区 把地区放到areas中 HashSet<String> areas = broadcasts.get(key);//这个方法是通过key 取value 也就是地区 tempSet.addAll(areas); //把地区放到tempset中 //求出tempSet 和 allAreas 集合的交集, 交集会赋给 tempSet tempSet.retainAll(allAreas); //如果当前这个集合包含的未覆盖地区的数量,比maxKey指向的集合地区还多 //就需要重置maxKey 意思就是把地区最多的电台赋给maxkey // tempSet.size() >broadcasts.get(maxKey).size()) 体现出贪心算法的特点,每次都选择最优的 //(tempSet.size() > 0 说明还未覆盖完所有地区 因为是和 allAreas还有交集 if(tempSet.size() > 0 && (maxKey == null || tempSet.size() >broadcasts.get(maxKey).size())){ maxKey = key; } } //maxKey != null, 就应该将maxKey 加入selects if(maxKey != null) { selects.add(maxKey); //将maxKey指向的广播电台覆盖的地区,从 allAreas 去掉 allAreas.removeAll(broadcasts.get(maxKey)); } } System.out.println("得到的选择结果是" + selects);//[K1,K2,K3,K5] } }