论文地址: https://pdos.csail.mit.edu/6.824/papers/vm-ft.pdf
概述
要想保证可用性, 有一种常用的策略是使用主备策略, 主服务挂了, 立刻切换到备份服务器. 主要有2种办法.
- 将主服务器的数据实时传送到备份服务器, 包括CPU, 内存, I/O等, 但是这个对带宽要求太高.
- 将服务器看作为状态机, 主备服务器初始化一个相同的状态, 然后接受相同的输入, 那么状态就会保持一致.
虚拟机比物理机具有很大的优势来执行这一策略, 虚拟机管理程序可以完全复制一台虚拟机的输入到另外一台虚拟机上.
我们已经用VMware vSphere 4.0平台搭建了一套系统, 支持x86虚拟机的自动备份和恢复, 但是现在只实现了单核虚拟机的复制, 多核虚拟机的复制还有问题.
首先, 描述我们的设计和细节. 怎么做到备份服务器在接管服务时没有丢失任何数据. 然后, 我们描述在创建一个稳定, 完全, 自动化的系统时遇到的细节问题. 我们也会讲下我们的设计抉择, 讨论tradeoff. 接下来, 我们给一个性能测试结果. 最后我们讲下相关的工作和结论.