Redis主从复制

Redis主从复制是指将一个Redis服务器（主节点）的数据复制到其他Redis服务器（从节点）的过程，通过主从复制可以实现数据的备份、读写分离、负载均衡等功能。主从复制的实现可以提高系统的可用性和性能。

主从复制，是指将一台Redis服务器的数据，复制到其他的Redis服务器。前者称为主节点(master)，后者称为从节点(slave)；

数据的复制是单向的，只能由主节点到从节点。

默认情况下，每台Redis服务器都是主节点，且一个主节点可以有多个从节点(或没有从节点)，但一个从节点只能有一个主节点。

主从复制的工作原理

初始化同步：从节点连接主节点，发送SYNC命令请求全量复制数据。
全量复制：主节点根据SYNC命令，将数据快照发送给从节点，从节点接收并加载数据。
增量复制：主节点将接收到的写命令发送给从节点，从节点执行相同的写命令，保持数据同步。
心跳检测：主节点定期发送心跳检测给从节点，确保连接正常。
故障转移：当主节点宕机或不可用时，从节点会选举出新的主节点，保证系统的可用性。

主从复制的实现原理

总的来说主从复制功能的详细步骤可以分为7个步骤：

设置主节点的地址和端口
建立套接字连接
发送PING命令
权限验证
同步
命令传播

接下来分别叙述每个步骤，整个流程图如下：

主从复制配置

1. 设置主服务器的地址和端口

第一步首先是在从服务器设置需要同步的主服务器信息，包括机器IP, 端口。主从复制的开启，完全是在从节点发起的；不需要我们在主节点做任何事情。

从节点开启主从复制，有3种方式：

（1）配置文件

在从服务器的配置文件中加入：slaveof masterip masterport

（2）启动命令

redis-server启动命令后加入 --slaveof masterip masterport

（3）客户端命令

Redis服务器启动后，直接通过客户端执行命令：slaveof masterip masterport，则该Redis实例成为从节点。

上述3种方式是等效的，下面以客户端命令的方式为例，看一下当执行了slaveof后，Redis主节点和从节点的变化。

完成上面的配置后，从服务器会将主服务器的ip地址和端口号保存到服务器状态的属性里面。可以Redis使用info Replication 命令分别查看从服务器和主服务器的主从信息

2. 建立套接字连接

在slaveof命令执行之后，从服务器会根据设置的ip和端口，向主服务器简历socket连接。在6380从服务器里面执行完slave of 127.0.0.1 6379后意味着，从服务器向主服务器发起socket连接在执行info Replication 命令，6380服务器的角色是slave了

3. 发送PING命令

从节点成为主节点的客户端之后，发送ping命令进行首次请求，目的是：检查socket连接是否可用，以及主节点当前是否能够处理请求。

从节点发送ping命令后，可能出现3种情况：

（1）返回pong：说明socket连接正常，且主节点当前可以处理请求，复制过程继续。

（2）超时：一定时间后从节点仍未收到主节点的回复，说明socket连接不可用，则从节点断开socket连接，并重连。

（3）返回pong以外的结果：如果主节点返回其他结果，如正在处理超时运行的脚本，说明主节点当前无法处理命令，则从节点断开socket连接，并重连。

4. 身份验证

如果从节点中设置了masterauth选项，则从节点需要向主节点进行身份验证；没有设置该选项，则不需要验证。从节点进行身份验证是通过向主节点发送auth命令进行的，auth命令的参数即为配置文件中的masterauth的值。

如果主节点设置密码的状态，与从节点masterauth的状态一致（一致是指都存在，且密码相同，或者都不存在），则身份验证通过，复制过程继续；如果不一致，则从节点断开socket连接，并重连。

5. 同步

同步就是将从节点的数据库状态更新成主节点当前的数据库状态。具体执行的方式是：从节点向主节点发送psync命令（Redis2.8以前是sync命令），开始同步。数据同步阶段是主从复制最核心的阶段，根据主从节点当前状态的不同，可以分为全量复制和部分复制

全量复制和部分复制

在Redis2.8以前，从节点向主节点发送sync命令请求同步数据，此时的同步方式是全量复制；在Redis2.8及以后，从节点可以发送psync命令请求同步数据，此时根据主从节点当前状态的不同，同步方式可能是全量复制或部分复制。后文介绍以Redis2.8及以后版本为例。

全量复制：用于初次复制或其他无法进行部分复制的情况，将主节点中的所有数据都发送给从节点，是一个非常重型的操作。
部分复制：用于网络中断等情况后的复制，只将中断期间主节点执行的写命令发送给从节点，与全量复制相比更加高效。需要注意的是，如果网络中断时间过长，导致主节点没有能够完整地保存中断期间执行的写命令，则无法进行部分复制，仍使用全量复制。

6. 命令传播

经过上面同步操作，此时主从的数据库状态其实已经一致了，但这种一致的状态的并不是一成不变的。在完成同步之后，也许主服务器马上就接受到了新的写命令，执行完该命令后，主从的数据库状态又不一致。

数据同步阶段完成后，主从节点进入命令传播阶段；在这个阶段主节点将自己执行的写命令发送给从节点，从节点接收命令并执行，从而保证主从节点数据的一致性。

延迟与不一致和 心跳机制

延迟与不一致 需要注意的是，命令传播是异步的过程，即主节点发送写命令后并不会等待从节点的回复；因此实际上主从节点之间很难保持实时的一致性，延迟在所难免。数据不一致的程度，与主从节点之间的网络状况、主节点写命令的执行频率、以及主节点中的repl-disable-tcp-nodelay配置等有关。

repl-disable-tcp-nodelay 配置如下：

假如设置成yes，则redis会合并小的TCP包从而节省带宽，但会增加同步延迟（40ms），造成master与slave数据不一致
假如设置成no，则redis master会立即发送同步数据，没有延迟

概括来说就是：前者关注性能，后者关注一致性

具体发送频率与Linux内核的配置有关，默认配置为40ms。当设置为no时，TCP会立马将主节点的数据发送给从节点，带宽增加但延迟变小。

一般来说，只有当应用对Redis数据不一致的容忍度较高，且主从节点之间网络状况不好时，才会设置为yes；多数情况使用默认值no

Redis是如何保证主从服务器一致处于连接状态以及命令是否丢失？

答：命令传播阶段，从服务器会利用心跳检测机制定时的向主服务发送消息。

心跳检测机制

心跳检测机制的作用有三个：

检查主从服务器的网络连接状态
辅助实现min-slaves选项
检测命令丢失

检查主从服务器的网络连接状态

主节点信息中可以看到所属的从节点的连接信息：

state 表示从节点状态
offset 表示复制偏移量
lag 表示延迟值（几秒之前有过心跳检测机制）

辅助实现min-slaves选项

Redis.conf配置文件中有下方两个参数

# 未达到下面两个条件时，写操作就不会被执行
# 最少包含的从服务器
# min-slaves-to-write 3
# 延迟值
# min-slaves-max-lag 10

如果将两个参数的注释取消，那么如果从服务器的数量少于3个，或者三个从服务器的延迟（lag）大于等于10秒时，主服务器都会拒绝执行写命令。

检测命令丢失

在从服务器的连接信息中可以看到复制偏移量，如果此时主服务器的复制偏移量与从服务器的复制偏移量不一致时，主服务器会补发缺失的数据。

主从复制的作用

数据冗余：主从复制实现了数据的热备份，是持久化之外的一种数据冗余方式。
故障恢复：当主节点出现问题时，可以由从节点提供服务，实现快速的故障恢复；实际上是一种服务的冗余。
负载均衡：在主从复制的基础上，配合读写分离，可以由主节点提供写服务，由从节点提供读服务（即写Redis数据时应用连接主节点，读Redis数据时应用连接从节点），分担服务器负载；尤其是在写少读多的场景下，通过多个从节点分担读负载，可以大大提高Redis服务器的并发量。
高可用基石：主从复制还是哨兵和集群能够实施的基础，因此说主从复制是Redis高可用的基础。

主从复制的注意事项

网络稳定：主从节点之间的网络连接要稳定，避免数据同步延迟或丢失。
数据一致性：主从节点之间的数据同步要保持一致，避免数据不一致导致的问题。
监控和报警：建议对主从复制进行监控和报警设置，及时发现和处理问题。
版本兼容：主从节点的Redis版本要保持一致，避免版本不兼容导致的问题。

哨兵模式

在主从模式下，主从复制机制使得slave成为与master完全一致的副本，一旦master宕机，我们可以选择一个正常的slave成为新的主节点，实现手动的故障恢复。但是，人工干预效率低、易出错，并且故障感知滞后，不具备生产实用性。
Redis官方提供一个Redis的高可用方案——哨兵（Sentinel），使用它可以搭建一个即使无人干预也能抵抗某些类型失败的高可用的Redis分布式系统。
哨兵是Redis的一种运行模式，它专注于对Redis实例（主节点、从节点）运行状态的监控，并能够在主节点发生故障时通过一系列的机制实现选主及主从切换，实现故障转移，确保整个Redis系统的可用性。

Redis哨兵具备的能力有如下几个：

监控（Monitoring）：持续监控Redis主节点、从节点是否处于预期的工作状态。
通知（Notification）：哨兵可以把Redis实例的运行故障信息通过API通知监控系统或者其他应用程序。
自动故障恢复（Automatic failover）：当主节点运行故障时，哨兵会启动自动故障恢复流程：某个从节点会升级为主节点，其他从节点会使用新的主节点进行主从复制，通知客户端使用新的主节点进行。
配置中心（Configuration provider）：哨兵可以作为客户端服务发现的授权源，客户端连接到哨兵请求给定服务的Redis主节点地址。如果发生故障转移，哨兵会通知新的地址。这里要注意：哨兵并不是Redis代理，只是为客户端提供了Redis主从节点的地址信息。

哨兵模式是天然的分布式系统，它被设计为基于一套配置，并在多个哨兵实例的配合下工作。多实例共同协作有以下优势：

主节点的系统故障是在多个实例共同认可的情况下完成的，大大降低了误报的概率。
即使不是所有的哨兵实例都正常运行哨兵集群也能正常工作，这大大增加了系统的鲁棒性。

哨兵集群搭建过程

搭建Redis哨兵集群通常需要至少3个哨兵节点和1个Redis主节点以及其对应的从节点。

一主二从

哨兵

依次启动三个Redis Server
依次启动三个Redis Sentinel

哨兵机制提供三个功能：监控、故障转移、通知。

监控：sentinel 系统可以监控任意多个主服务，以及主服务所属的所有从服务器，监控着他们的生命状态。
故障转移：当Redis主服务挂掉之后，sentinel系统会从其所属的从服务器中选取一台从服务器作为master服务器保证服务的高可用。
通知：sentinel系统会将主服务节点和从服务器节点相关信息通知到客户端，让客户端的数据始终为最新状态。

监控指的就是哨兵进程运行时，它会周期性地心跳检测，检测所有主从服务器是否正常运行。心跳检测方式为周期性向主从服务器发送PING命令，若主从服务器在规定时间内响应哨兵进程，则判断该服务器处于存活状态；若主从服务器在规定时间内没有响应哨兵进程，则哨兵进程会判定其下线。

若主服务器处于下线状态时，哨兵进程会进行故障转移，也就是重新选主。选主就是会从其所属的多个从服务器中选举一个服务器作为新的主服务器，来提供服务。选举成功后，哨兵进程让已下线主服务器属下的所有从服务器去复制新的主服务器，这一动作会通过向从服务器发送SLAVEOF命令来实现。

若旧的主服务器重新启动后，会成为新的主服务器的从服务器。

哨兵选举出新的主服务器后，会将新主服务器信息发送给客户端，让它和新的主服务器建立连接就行，并不涉及决策的逻辑。但是，在监控和选举过程中，哨兵需要做出两个决策：一个是判断主库是否下线；第二个是在选举过程中，选举哪个从服务器作为新的主服务器，提供服务。

sentinel获取主从服务器信息

sentinel进程默认会以每隔10秒一次的频率，通过命令连接向被连接的主服务器发送INFO命令，并通过分析INFO命令返回的数据来获取主服务器的当前信息以及所属从服务器信息。

多个sentinel进行通信

在哨兵集群下，哨兵实例进行通信，是基于Redis提供的pub/sub机制的，也就是发布/订阅模式。

在主从集群中，哨兵节点不会直接与其他哨兵节点建立连接，而是首先会和主库建立起连接，然后向一个名为"_sentinel_:hello"频道发送自己的信息（IP+port），其他订阅了该频道的哨兵节点就会获取到该哨兵节点信息，从而哨兵节点之间互知。

通俗讲，Redis哨兵模式中，哨兵节点的互通是通过订阅指定的频道来进行的，而不是直接与其他sentinel节点建立起连接。

主观下线和客观下线

首先先解释一下什么是"主观下线"。

哨兵进程会使用PING命令的方式来检测各个主库和从库的网络连接情况，用来判断实例状态。如果哨兵发现主库或者从库响应超时，那么哨兵会判定其为"主观下线"。

如果哨兵检测从库，发现从库在规定时间内未响应，那么哨兵就会把它标记为"主观在线"，因为从库的下线影响一般不太大，集群的对外服务不会间断。但是，如果检测主库，哨兵不会简单把它标记为"主观在线"，开启主从切换。

因为很有可能会有一种特殊情况：哨兵误判。也就是说主库本身没有故障，但由于哨兵的误判，判断它为下线状态。一旦启动主从切换，后续的选举和通知操作都会带来额外的计算和通信开销。因此，为了不必要开销，我们要严格注意误判的情况。

在哨兵集群中，判定主库是否处于下线状态，不是由一个哨兵来决定的，而是只有大多数哨兵认为主库已经"主观下线"，主库才会标记为"客观下线"。这种判断机制为：少数服从多数。同时会触发主从切换模式。

选举新库

哨兵选举新主的过程总结为"筛选+排序"。首先，哨兵会按照一定的筛选机制筛选掉不符合要求的从库，然后从符合条件的从库中进行排序，从而诞生出新库。

筛选机制。

筛除掉所有处于下线或者断线状态的从服务器，这可以保证剩余的从服务器都是正常在线的。
筛除掉所有在规定时间内没有响应哨兵的INFO命令的从服务器，这可以保证剩余的从服务器都是最近成功进行通信的。
筛除掉所有与已下线主服务器连接断开超过down-after-milliseconds*10毫秒的从服务器，这样可以保证剩余的从服务器都没有过早地与主服务器断开连接，换句话来说，列表中的从服务器保存的数据都是比较新的。

排序机制。

哨兵会根据从服务器的优先级，对列表中剩余的从服务器进行排序，选出优先级最好的从服务器。
若有多个相同最好优先级的从服务器，那么哨兵会按照复制偏移量对具有相同优先级的所有从服务器进行排序，并选出其中偏移量最大的从服务器。
若有多个优先级最高、复制偏移量最大的从服务器，那么哨兵将按照运行ID对这些从服务器进行排序，并选出其中运行ID最小的从服务器。

选举过程：首先哨兵会筛选掉已下线、断线状态、网络状态不好的从服务器，其次，会根据从服务器优先级、复制偏移量、运行ID方面进行排序，最终得到一个从服务器，那么该从服务器为新的主服务器。

基于pub/sub机制的客户端事件通知

从本质上说，哨兵就是一个运行在特定模式的Redis，只不过它并不服务于请求操作，只是完成监控、故障转移、通知的任务。每个哨兵提供pub/sub机制，客户端可以从哨兵订阅消息。

客户端可以从哨兵订阅所有事件，这样客户端不仅可以在主从切换后得到新主库的连接信息，还可以监控主从库切换过程中发生的各个重要事件。

总结

sentinel只是一个运行在特殊环境下的Redis，不提供数据存储服务。
sentinel会通过向主服务器发送INFO命令获取主服务器所属的从服务器的地址信息，并为这些从服务器创建相应的实例结构，以及向这些从服务器发送命令连接和订阅连接。
在一般情况下，sentinel会以每10s一次的频率向被监视的主库和从库发送INFO命令，获取主库和从库的相关信息。当主库处于下线状态，或者sentinel正对主服务器进行故障转移操作时，sentinel向从服务发送INFO命令的频率修改为每秒一次。
对于监控同一个主服务器的哨兵来说，他们通过向主服务器的_sentinel_:hello发送消息来向其他sentinel告知自己的存在。其他订阅了该频道的sentinel都可以接收到，从而各个sentinel互知。
sentinel只会与主服务器和从服务器之间建立命令连接和订阅连接，而sentinel之间只会建立命令建立，进行通信。
sentinel会以每秒一次的频率向实例（从服务器、主服务器、其他sentinel）发送PING命令，并根据实例对PING命令的回复来判断实例是否在线，当一个实例在指定时间内未响应PING命令，则判定其为主观下线。
在哨兵集群下，当sentinel收到足够多的主观下线投票之后，他会将主服务器判断为客观下线，并发起一个针对主服务器的故障转移操作。

缓存击穿

缓存击穿是指，针对某个访问非常频繁的热点数据的请求，无法在缓存中获取，紧接着，访问该数据的大量请求，一下子都发送到了后端数据库，导致了数据库压力激增，直接影响数据库无法处理其他请求。

说白了，就是某一个热点数据，缓存中某一时刻失效了，因而大量并发请求打到数据库上，就像redis被打了一个窟窿，被击穿了一样，此时，该数据redis中没有，数据库中才有。

解决方案

①、加锁更新，⽐如请求查询 A，发现缓存中没有，对 A 这个 key 加锁，同时去数据库查询数据，写⼊缓存，再返回给⽤户，这样后⾯的请求就可以从缓存中拿到数据了。

三分恶面渣逆袭：加锁更新

②、将过期时间组合写在 value 中，通过异步的⽅式不断的刷新过期时间，防⽌此类现象。

缓存穿透

缓存穿透是指要访问的数据既不在 Redis 缓存中，也不在数据库中，导致请求在访问缓存时，发生缓存缺失，再去访问数据库时，发现数据库中也没有要访问的数据。此时，应用也无法从数据库中读取数据再写入缓存，来服务后续请求，这样一来，缓存也就成了“摆设”。

缓存穿透可能有两种原因：

自身业务代码问题
恶意攻击，爬虫造成空命中

它主要有两种解决办法：

①、缓存空值/默认值

在数据库无法命中之后，把一个空对象或者默认值保存到缓存，之后再访问这个数据，就会从缓存中获取，这样就保护了数据库。

三分恶面渣逆袭：缓存空值/默认值

缓存空值有两大问题：

空值做了缓存，意味着缓存层中存了更多的键，需要更多的内存空间（如果是攻击，问题更严重），比较有效的方法是针对这类数据设置一个较短的过期时间，让其自动剔除。
缓存层和存储层的数据会有一段时间窗口的不一致，可能会对业务有一定影响。

例如过期时间设置为 5 分钟，如果此时存储层添加了这个数据，那此段时间就会出现缓存层和存储层数据的不一致。

这时候可以利用消息队列或者其它异步方式清理缓存中的空对象。

②、布隆过滤器

除了缓存空对象，我们还可以在存储和缓存之前，加一个布隆过滤器，做一层过滤。

布隆过滤器里会保存数据是否存在，如果判断数据不存在，就不会访问存储。

三分恶面渣逆袭：布隆过滤器

两种解决方案的对比：

三分恶面渣逆袭：缓存空对象和布隆过滤器方案

缓存雪崩

缓存雪崩，指的是大面积的 key 同时过期，导致大量并发打到我们的数据库。不像击穿，只是因为 1 个 key 的过期。那就算一个 key 失效，也会对数据库造成很大的影响，那么可以把雪崩的所有 key 拆成一个一个 key 来看，也就是雪崩可以拆分成一个一个缓存击穿的集合。

其实在真实场景中，雪崩才是一个更容易发生的一个问题，它不像击穿那么极端，一个 key 就成千上万的并发，直接把数据库打垮了；而是，可能就一个 key 几十几百的并发，然后大量的 key 一过期，然后就使得好多并发同时叠加起来，累积到上千上万个，把数据库打崩了。

解决方案

第一种：提高缓存可用性

01、集群部署：采用分布式缓存而不是单一缓存服务器，可以降低单点故障的风险。即使某个缓存节点发生故障，其他节点仍然可以提供服务，从而避免对数据库的大量直接访问。

02、备份缓存：对于关键数据，除了在主缓存中存储，还可以在备用缓存中保存一份。当主缓存不可用时，可以快速切换到备用缓存，确保系统的稳定性和可用性。

当从 Redis 获取数据失败时，尝试从本地缓存读取数据。

LoadingCache<String, UserPermissions> permissionsCache = Caffeine.newBuilder()
    .maximumSize(1000)
    .expireAfterWrite(10, TimeUnit.MINUTES)
    .build(this::loadPermissionsFromRedis);

public UserPermissions loadPermissionsFromRedis(String userId) {
    try {
        return redisClient.getPermissions(userId);
    } catch (Exception ex) {
        // Redis 异常处理，尝试从本地缓存获取
        return permissionsCache.getIfPresent(userId);
    }
}

第二种：过期时间

对于缓存数据，设置不同的过期时间，避免大量缓存数据同时过期。可以通过在原有过期时间的基础上添加一个随机值来实现，这样可以分散缓存过期时间，减少同一时间对数据库的访问压力。

第三种：限流和降级

通过设置合理的系统限流策略，如令牌桶或漏斗算法，来控制访问流量，防止在缓存失效时数据库被打垮。

此外，系统可以实现降级策略，在缓存雪崩或系统压力过大时，暂时关闭一些非核心服务，确保核心服务的正常运行。

布隆过滤器（Bloom Filter）

布隆过滤器（Bloom Filter）是一种空间效率极高的概率型数据结构，用于快速检查一个元素是否存在于一个集合中。

布隆过滤器由一个长度为 m 的位数组和 k 个哈希函数组成。

开始时，布隆过滤器的每个位都被设置为 0。
当一个元素被添加到过滤器中时，它会被 k 个哈希函数分别计算得到 k 个位置，然后将位数组中对应的位设置为 1。
当检查一个元素是否存在于过滤器中时，同样使用 k 个哈希函数计算位置，如果任一位置的位为 0，则该元素肯定不在过滤器中；如果所有位置的位都为 1，则该元素可能在过滤器中。

三分恶面渣逆袭：布隆过滤器

因为布隆过滤器占用的内存空间非常小，所以查询效率也非常高，所以在 Redis 缓存中，使用布隆过滤器可以快速判断请求的数据是否在缓存中。

但是布隆过滤器也有一定的缺点，因为是通过哈希函数计算的，所以存在哈希冲突的问题，可能会导致误判。

Lua 脚本的使用

Lua 是一种轻量级的脚本语言，被广泛应用于各种系统和软件中，包括 Redis 数据库。在 Redis 中，Lua 脚本可以通过 EVAL 命令来执行，用于实现一些复杂的操作和事务。

Lua 脚本的优势

原子性操作：Lua 脚本在 Redis 中的执行是原子性的，可以保证多个命令的连续执行不会被其他命令插入。
减少网络开销：将多个操作封装在一个 Lua 脚本中，可以减少网络通信开销，提高性能。
复杂逻辑：Lua 脚本支持复杂的逻辑判断和计算，可以实现一些 Redis 命令无法完成的功能。

Lua 脚本的执行

在 Redis 中，可以通过 EVAL 命令来执行 Lua 脚本。EVAL 命令的基本语法如下：

EVAL script numkeys key [key ...] arg [arg ...]

script：表示要执行的 Lua 脚本。
numkeys：表示脚本中用到的键的数量。
key [key ...]：表示 Lua 脚本中用到的键。
arg [arg ...]：表示 Lua 脚本中用到的参数。

Lua 脚本示例

下面是一个简单的 Lua 脚本示例，用于实现将指定键的值增加 1：

local current = redis.call('GET', KEYS[1])
if current then
    redis.call('SET', KEYS[1], current + 1)
    return current + 1
else
    return nil
end

在这个示例中，首先通过 GET 命令获取指定键的值，然后判断是否存在该键，如果存在则将其值加 1 并更新，最后返回增加后的值。

Lua 脚本的注意事项

避免阻塞：Lua 脚本的执行是单线程的，如果脚本执行时间过长，可能会导致 Redis 阻塞。
保证幂等性：Lua 脚本在执行过程中应该保证幂等性，即多次执行结果应该一致。
错误处理：在 Lua 脚本中应该处理可能出现的错误情况，以避免影响 Redis 的正常运行。

总的来说，Lua 脚本在 Redis 中的应用可以帮助实现复杂的操作和逻辑，提高系统的性能和可靠性。

Redis集群

Redis集群是用于在多个Redis节点之间分布数据和负载的解决方案。通过Redis集群，可以实现数据的分片存储、提高系统的可用性和性能，以及横向扩展Redis的能力。

Redis集群的特点

分布式存储：Redis集群将数据分布存储在多个节点上，每个节点只存储部分数据，通过分片技术实现数据的分布式存储。
高可用性：Redis集群支持主从复制和故障转移机制，当主节点宕机时，可以自动选举从节点为新的主节点，保证系统的可用性。
负载均衡：通过数据分片和多节点存储，Redis集群可以实现负载均衡，均衡地分配请求到各个节点，提高系统的性能。
横向扩展：Redis集群支持动态添加和移除节点，可以根据业务需求灵活扩展集群的规模，满足不断增长的数据存储需求。

Redis集群架构

Redis集群采用分布式哈希槽（hash slot）的方式来实现数据分片和负载均衡。每个Redis节点负责管理一部分哈希槽，将数据根据哈希算法分配到对应的槽中。

Redis集群的工作原理

哈希槽分配：将数据根据哈希算法映射到一个固定数量的哈希槽中。
节点间通信：各个Redis节点之间通过Gossip协议进行通信，维护集群的拓扑结构和节点状态。
数据路由：客户端请求到达集群时，根据数据的哈希值路由到对应的节点，实现数据的读写操作。
故障转移：当主节点宕机时，集群会自动选举一个从节点作为新的主节点，保证数据的可用性。

Redis集群的配置

在Redis集群中，需要配置多个节点，每个节点都需要指定集群的端口、工作目录、哈希槽范围等信息。通过配置文件或命令行参数可以启动和管理Redis集群。

Redis集群的部署

部署Redis集群时，需要注意以下几点：

节点数量：建议至少3个主节点和3个从节点，以保证集群的高可用性。
网络配置：确保各个节点之间的网络通信畅通，避免通信延迟或丢包。
监控和维护：定期监控集群的运行状态，及时处理节点故障或数据不一致的情况。
数据迁移：在扩展集群规模或替换节点时，需要进行数据迁移操作，保证数据的完整性和一致性。

Redis集群的优势

高性能：通过数据分片和负载均衡，提高了系统的读写性能。
高可用性：支持故障转移和自动恢复机制，保证了系统的稳定性和可用性。
横向扩展：可以根据业务需求动态扩展集群规模，满足不同规模的数据存储需求。
数据一致性：通过主从复制和哈希槽分配，保证了数据的一致性和完整性。
易于管理：提供了丰富的管理工具和监控指标，方便运维人员进行集群管理和维护。

通过Redis集群，可以构建一个高性能、高可用的分布式缓存系统，满足大规模应用的数据存储和访问需求。

If you find the article useful, feel free to appreciate

Redis基础（三）

https://blog.mykele.asia/archives/redisji-chu-san

Author

kele

Published on

2024-09-19

Updated on

2024-09-19

License

CC BY 4.0

Redis基础（三）

Redis主从复制

主从复制的工作原理

主从复制的实现原理

主从复制配置

1. 设置主服务器的地址和端口

2. 建立套接字连接

3. 发送PING命令

4. 身份验证

5. 同步

全量复制和部分复制

6. 命令传播

心跳检测机制

检查主从服务器的网络连接状态

辅助实现min-slaves选项

检测命令丢失

主从复制的作用

主从复制的注意事项

哨兵模式

哨兵集群搭建过程

哨兵机制提供三个功能：监控、故障转移、通知。

sentinel获取主从服务器信息

多个sentinel进行通信

主观下线和客观下线

选举新库

基于pub/sub机制的客户端事件通知

总结

缓存击穿

解决方案

缓存穿透

缓存雪崩

解决方案

布隆过滤器（Bloom Filter）

Lua 脚本的使用

Lua 脚本的优势

Lua 脚本的执行

Lua 脚本示例

Lua 脚本的注意事项

Redis集群

Redis集群的特点

Redis集群架构

Redis集群的工作原理

Redis集群的配置

Redis集群的部署

Redis集群的优势

Author

Published on

Updated on

License

Comments