2015-2018,部分关于SDN数据平面的故障恢复文献粗读
SHEAR: A highly available and flexible network architecture marrying distributed and logically centralized control planes
- International Conference on Network Protocols
- 2016
- 问题:传统网络中检测故障方法笨重,而全部替换成SDN网络成本太大;
- 提出一种混合的网络架构,在传统网络中使用少量(2%-10%)的OpenFlow交换机代替传统交换机,将一个网络划分为几个域并使用传统的STP来定位故障,之后交给控制器处理;
Enhanced fast failover for software-defined smart grid communication networks
- IEEE Global Communications Conference
- 2016
- 问题:第一个针对智能电网提出的恢复策略;
- 在特定的应用场景(自动化基站,大范围监控,保护和控制)中实现两张恢复策略:中心控制、本地控制;
Scalable Multi-Failure Fast Failover via Forwarding Table Compression
- the Symposium on SDN Research
- 2016
- 问题:在使用本地备用路径策略时,过多较少使用的备用流表项会降低TCAM的可用空间;
- 分析了故障恢复的方法,并以此提出一种针对故障恢复的流表项压缩算法,使得能够使用更少的流表项来处理更多的故障;
Path switching: reduced-state flow handling in SDN using path information
- Conference on Emerging Networking Experiments and Technologies
- 2015
- 在SDN网络中一直实现基于路径的源路由,在数据包中加入该包的路由信息。只在摘要中提到failover mechanisms,其他内容和failover没什么关系;
Fast failover and switchover for link failures and congestion in software defined networks
- IEEE International Conference on Communications
- 2016
- 问题:将链路的阻塞也看成一种故障处理;
- 监控各个端口的流量并设置阈值,通过为每个<源,目的>预设置多个路径来实现负载均衡和快速故障恢复;
Fast Detection of Alternative Route under Unknown Failure on SDN Network
- IEEE Global Communications Conference
- 2017
- 问题:传统的备用路径只是绕过故障点,而没有考虑数据流对时延的要求;
- 在使用Dijkstra算法发现基于<源,目的>的备用路径后,再进行剪枝来筛选出最符合要求的路径;
Troubleshooting Data Plane With Rule Verification in Software-Defined Networks
- IEEE Transactions on Network and Service Management
- 2018
- 问题:探测故障的探针一次只能检测很有限的流规则,或者只能检测出某条链路故障而不能定位故障的具体位置。因此,确定故障位置或者故障的流规则需要大量的计算时间;
- 提出一直关于流规则的模型,针对每个交换机来最小化需要的探针数量。貌似没有恢复部分,纯的故障位置发现;
DEMUR: Dependable Multipath Routing in Software Defined Networking for ISP Backbone
- IEEE Global Communications Conference
- 2017
- 问题:多径路由中,各个路径的时延差距过大,导致目的节点需要大量空间来存储前到的数据包;
- 提出的方法能一定程度提供网络恢复能力;
A declarative failure recovery system in software defined networks
- IEEE International Conference on Communications
- 2016
- 问题:故障恢复时,需要针对不同应用实施不同的恢复方法;
- 两种故障恢复方法:控制器处理、本地流表项处理各有优劣。故障时,根据不同流对资源的需求,实行各自的策略,需要由网络操作员设置;
Generalized Recovery From Node Failure in Virtual Network Embedding
- IEEE Transactions on Network and Service Management
- 2017
- 问题:在虚拟网络中,一个物理节点或链路故障可能会影响多个虚拟网络;
- 提出两种贪婪方法:优先数量或者虚拟节点优先级来重映射虚拟网;
The show must go on: Fundamental data plane connectivity services for dependable SDNs
- computer communications
- 2017
- 提出问题:本地的故障恢复流表或组表必须预先配置,没有发送故障时的信息;有可能会将流引到其他的故障点;
- 提出三种基于OpenFLow协议的机制:无状态,标记,有状态;在数据平面实现inband network traversals。三种方法都能找打需要的路径,不过各有缺点:路径长度、新增的流表数、数据包头需要的标记数;
Surviving Multiple Failures in Multicast Virtual Networks With Virtual Machines Migration
- IEEE TRANSACTIONS ON NETWORK AND SERVICE MANAGEMENT
- 2016
- 问题:考虑组播虚拟网中,某个物理节点或链路故障;
重新映射整个组播树,需要大量时间和计算;
备用的节点可能存在资源不足; - 对组播树中的其他节点进行筛选和排序(根据资源,和故障的节点等),选择合适的节点代替故障节点;