Redis实现分布式锁

Posted on 2017-10-23 Edited on 2024-09-02 Views: Valine:

之前我们使用的定时任务都是只部署在了单台机器上，为了解决单点的问题，为了保证一个任务，只被一台机器执行，就需要考虑锁的问题，于是就花时间研究了这个问题。到底怎样实现一个分布式锁呢？

锁的本质就是互斥，保证任何时候能有一个客户端持有同一个锁，如果考虑使用redis来实现一个分布式锁，最简单的方案就是在实例里面创建一个键值，释放锁的时候，将键值删除。但是一个可靠完善的分布式锁需要考虑的细节比较多，我们就来看看如何写一个正确的分布式锁。

单机版分布式锁 SETNX

所以我们直接基于 redis 的 setNX (SET if Not eXists)命令，实现一个简单的锁。直接上伪码

锁的获取：

1	SET resource_name my_random_value NX PX 30000

锁的释放：

if redis.call("get",KEYS[1]) == ARGV[1] then
    return redis.call("del",KEYS[1])
else
    return 0
end

几个细节需要注意：

注意了以上细节，一个单redis节点的分布式锁就达成了。

在这个分布式锁中还是存在一个单点的redis。也许你会说，Redis是 master-slave的架构，发生故障的时候切换到slave就好，但是Redis的复制是异步的。

这样由于Master的宕机，造成了同时多人持有锁。如果你的系统可用接受短时时间内，有多人持有锁。这个简单的方案就能解决问题。

但是如果解决这个问题。Redis的官方提供了一个Redlock的解决方案。

为了解决，Redis单点的问题。Redis的作者提出了RedLock的解决方案。方案非常的巧妙和简洁。
RedLock的核心思想就是，同时使用多个Redis Master来冗余，且这些节点都是完全的独立的，也不需要对这些节点之间的数据进行同步。

假设我们有N个Redis节点，N应该是一个大于2的奇数。RedLock的实现步骤:

取得当前时间
使用上文提到的方法依次获取N个节点的Redis锁。
如果获取到的锁的数量大于（N/2+1）个,且获取的时间小于锁的有效时间(lock validity time)就认为获取到了一个有效的锁。锁自动释放时间就是最初的锁释放时间减去之前获取锁所消耗的时间。
如果获取锁的数量小于（N/2+1），或者在锁的有效时间(lock validity time)内没有获取到足够的说，就认为获取锁失败。这个时候需要向所有节点发送释放锁的消息。

对于释放锁的实现就很简单了。想所有的Redis节点发起释放的操作，无论之前是否获取锁成功。

同时需要注意几个细节：

重试获取锁的间隔时间应当是一个随机范围而非一个固定时间。这样可以防止，多客户端同时一起向Redis集群发送获取锁的操作，避免同时竞争。同时获取相同数量锁的情况。（虽然概率很低）
如果某master节点故障之后，回复的时间间隔应当大于锁的有效时间。
1. 假设有A，B，C三个Redis节点。
2. 客户端foo获取到了A、B两个锁。
3. 这个时候B宕机，所有内存的数据丢失。
4. B节点恢复。
5. 这个时候客户端bar重新获取锁，获取到B，C两个节点。
6. 此时又有两个客户端获取到锁了。
所以如果恢复的时间将大于锁的有效时间，就可以避免以上情况发生。同时如果性能要求不高，甚至可以开启Redis的持久化选项。

了解了Redis分布式的实现以后，其实觉得大多数的分布式系统其实原理很简单，但是为了保证分布式系统的可靠性需要注意很多的细节，琐碎异常。
RedLock算法实现的分布式锁就是简单高效，思路相当巧妙。
但是RedLock就一定安全么？我还会写一篇文章来讨论这个问题。敬请大家期待。