死锁
为了线程安全,我们在需要的是会使用”独占锁“,但过多的锁定也会有麻烦。多个线程因为竞争资源相互等待而造成的僵局,我们称为死锁。若无外力作用,这些进程将都无法推进。在死锁中,至少有两个线程被挂起,并等待对方解除锁定。
我们先看一个小例子:在一个平面上有很多方块,有一些星星在这上面移动。基本规则就是:每个方块只能有一个星星。
(图1)
移动过程如下图,小黑想从a2方块移动到a3方块。这时小黑得占用a2位置,当a3位置为空时跳过去。
(图2)
当想移动的目标位置被其他星星占着的时候,就等其他星星移走后再移动过去。如下图小绿,会等到小黑移走后再移动到a2。
(图3)
但当小黑想移动的目标位置是b2的时候就悲剧了,固执的星星小黑和小绿将相互等待对方移走,直到永远。
(图4)
可能会出现更复杂的情况,小黑在等待小红移走,小红在等待小蓝移走,小蓝在等待小绿移走,小绿在等待小黑移走。这样僵持着!
(图5)
或更更复杂的情况(脑补)。。。
产生死锁的条件
产生死锁必须同时满足以下四个条件,只要其中任一条件不成立,死锁就不会发生。
- 互斥条件:进程要求对所分配的资源进行排他性控制,即在一段时间内某资源仅为一个进程所占有。此时若有其他进程请求该资源,则请求进程只能等待。对应我们例子就是,每个方块只能容的下一个星星。
- 不剥夺条件:进程所获得的资源在未使用完毕之前,不能被其他进程强行夺走,即只能由获得该资源的进程自己来释放(只能是主动释放)。对应我们的例子就是,星星只能等待目标位置星星自己走,而不能把它推下方块。
- 请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源已被其他进程占有,此时请求进程被阻塞,但对自己已获得的资源保持不放。对应我们的例子就是,星星得占着一个方块,然后找目标方块。
- 循环等待条件:存在一种进程资源的循环等待链,链中每一个进程已获得的资源同时被链中下一个进程所请求。
预防死锁
第1种方案:按照顺序加锁是一种有效的死锁预防机制。但是,这种方式需要你事先知道所有可能会用到的锁,但总有些时候是无法预知的。基本思想就是破坏产生死锁的必要条件——循环等待条件。
第2种方案:是在尝试获取锁的时候加一个超时时间,这也就意味着在尝试获取锁的过程中若超过了这个时限该线程则放弃对该锁请求。若一个线程没有在给定的时限内成功获得所有需要的锁,则会进行回退并释放所有已经获得的锁,然后等待一段随机的时间再重试。这段随机的等待时间让其它线程有机会尝试获取相同的这些锁,并且让该线程在没有获得锁的时候可以继续运行(加锁超时后可以先继续运行干点其它事情,再回头来重复之前加锁的逻辑)。这算是一种预防,没破坏死锁的必要条件。且,如果多个线程同时请求几个资源的时候,因为等待的时间有一样,容易出现重复尝试,始终得不到锁。
第3种方案:这种方案比较暴力,杜绝了死锁。但如果一个线程需要很多资源的时候,很浪费。且容易出现,因为所需的某一两种资源不能满足而不给分配资源。
第4、5种方案:这种方案破坏产生死锁的必要条件——请求和保持条件。但并不是什么情况下都能这么用。
第6种方案:这个就是死锁检测,当发现死锁的时候进行处理。
一个可行的做法是释放所有锁,回退,并且等待一段随机的时间后重试。这个和简单的加锁超时类似,不一样的是只有死锁已经发生了才回退,而不会是因为加锁的请求超时了。虽然有回退和等待,但是如果有大量的线程竞争同一批锁,它们还是会重复地死锁。
一个更好的方案是给这些线程设置优先级,让一个(或几个)线程回退,剩下的线程就像没发生死锁一样继续保持着它们需要的锁。如果赋予这些线程的优先级是固定不变的,同一批线程总是会拥有更高的优先级。为避免这个问题,可以在死锁发生的时候设置随机的优先级。