数据库和缓存保证一致性

一天，老板说「最近公司的用户越来越多了，但是服务器的访问速度越来越差的，阿旺帮我优化下，做好了给你画个饼！」。

程序员阿旺听到老板口中的「画饼」后就非常期待，没有任何犹豫就接下了老板给的这个任务。

阿旺登陆到了服务器，经过一番排查后，确认服务器的性能瓶颈是在数据库。

这好办，给服务器加上 Redis，让其作为数据库的缓存。

这样，在客户端请求数据时，如果能在缓存中命中数据，那就查询缓存，不用在去查询数据库，从而减轻数据库的压力，提高服务器的性能。

分别更新数据库和缓存

阿旺有了这个想法后，就准备开始着手优化服务器，但是挡在在他前面的是这样的一个问题。

由于引入了缓存，那么在数据更新时，不仅要更新数据库，而且要更新缓存，这两个更新操作存在前后的问题：

先更新数据库，再更新缓存；
先更新缓存，再更新数据库；

这样做会存在什么问题

阿旺没想到太多，他觉得最新的数据肯定要先更新数据库，这样才可以确保数据库里的数据是最新的，于是他就采用了「先更新数据库，再更新缓存」的方案。
阿旺经过几个夜晚的折腾，终于「优化好了服务器」，然后就直接上线了，自信心满满跑去跟老板汇报。老板不懂技术，自然也没多虑，就让后续阿旺观察下服务器的情况，如果效果不错，就跟阿旺谈画饼的事情。阿旺观察了好几天，发现数据库的压力大大减少了，访问速度也提高了不少，心想这事肯定成的了。
好景不长，突然老板收到一个客户的投诉，客户说他刚发起了两次更新年龄的操作，但是显示的年龄确还是第一次更新时的年龄，而第二次更新年龄并没有生效。老板立马就找了阿旺，训斥着阿旺说：「这么简单的更新操作，都有 bug？我脸往哪儿放？你的饼还要不要了？」
听到自己准备到手的饼要没了的阿旺瞬间就慌了，立马登陆服务器排查问题，阿旺查询缓存和数据库的数据后发现了问题。数据库的数据是客户第二次更新操作的数据，而缓存确还是第一次更新操作的数据，也就是出现了数据库和缓存的数据不一致的问题。这个问题可大了，阿旺经过一轮的分析，造成缓存和数据库的数据不一致的现象，是因为并发问题！
那换成「先更新缓存，再更新数据库」这个方案，还会有问题吗？依然还是存在并发的问题，分析思路也是一样。
所以，无论是「先更新数据库，再更新缓存」，还是「先更新缓存，再更新数据库」，这两个方案都存在并发问题，当两个请求并发更新同一条数据的时候，可能会出现缓存和数据库中的数据不一致的现象。

先更新数据库，再更新缓存？

举例：「请求 A 」和「请求 B 」两个请求，同时更新「同一条」数据，则可能出现这样的顺序：

A 请求先将数据库的数据更新为 1，然后在更新缓存前，请求 B 将数据库的数据更新为 2，紧接着也把缓存更新为 2，然后 A 请求更新缓存为 1。

此时，数据库中的数据是 2，而缓存中的数据却是 1。出现了缓存和数据库中的数据不一致的现象。

先更新缓存，再更新数据库？

举例：「请求 A 」和「请求 B 」两个请求，同时更新「同一条」数据，则可能出现这样的顺序：

A 请求先将缓存的数据更新为 1，然后在更新数据库前，B 请求来了，将缓存的数据更新为 2，紧接着把数据库更新为 2，然后 A 请求将数据库的数据更新为 1。

此时，数据库中的数据是 1，而缓存中的数据却是 2，出现了缓存和数据库中的数据不一致的现象。

改进：旁路缓存 (Cache Aside) 策略

阿旺定位出问题后，思考了一番后，决定在更新数据时，不更新缓存，而是删除缓存中的数据。然后，到读取数据时，发现缓存中没了数据之后，再从数据库中读取数据，更新到缓存中。

阿旺想的这个策略是有名字的，是叫 Cache Aside 策略，中文是叫旁路缓存策略。

该策略又可以细分为「读策略」和「写策略」。

写策略的步骤
- 更新数据库中的数据；
- 删除缓存中的数据。
读策略的步骤
- 如果读取的数据命中了缓存，则直接返回数据；
- 如果读取的数据没有命中缓存，则从数据库中读取数据，然后将数据写入到缓存，并且返回给用户。

阿旺在想到「写策略」的时候，又陷入更深层次的思考，到底该选择哪种顺序呢？

先删除缓存，再更新数据库；
先更新数据库，再删除缓存。

阿旺这次经过上次教训，不再「想当然」的乱选方案，因为老板这次给的饼很大啊，必须把握住。于是阿旺用并发的角度来分析，看看这两种方案哪个可以保证数据库与缓存的数据一致性。

先删除缓存，再更新数据库？

阿旺还是以用户表的场景来分析。

假设某个用户的年龄是 20，请求 A 要更新用户年龄为 21，所以它会删除缓存中的内容。这时，另一个请求 B 要读取这个用户的年龄，它查询缓存发现未命中后，会从数据库中读取到年龄为 20，并且写入到缓存中，然后请求 A 继续更改数据库，将用户的年龄更新为 21。

最终，该用户年龄在缓存中是 20（旧值），在数据库中是 21（新值），缓存和数据库的数据不一致。

先删除缓存，再更新数据库，在「读 + 写」并发的时候，还是会出现缓存和数据库的数据不一致的问题。

先更新数据库，再删除缓存？

继续用「读 + 写」请求的并发的场景来分析。

假如某个用户数据在缓存中不存在，请求 A 读取数据时从数据库中查询到年龄为 20，在未写入缓存中时另一个请求 B 更新数据。它更新数据库中的年龄为 21，并且清空缓存。这时请求 A 把从数据库中读到的年龄为 20 的数据写入到缓存中。

最终，该用户年龄在缓存中是 20（旧值），在数据库中是 21（新值）。

先更新数据库，再删除缓存，在「读 + 写」并发的时候，似乎还是可能会出现缓存和数据库的数据不一致的问题（但真的是这样吗，请看后文）。

改进：其他

利用耗时不同、以及增加过期时间

方法

从上面的理论上分析，先更新数据库，再删除缓存也是会出现数据不一致性的问题。
但是在实际中，这个问题出现的概率并不高。因为缓存的写入通常要远远快于数据库的写入。
所以在实际中很难出现请求 B 已经更新了数据库并且删除了缓存，请求 A 才更新完缓存的情况。
而一旦请求 A 早于请求 B 删除缓存之前更新了缓存，那么接下来的请求就会因为缓存不命中而从数据库中重新读取数据，所以不会出现这种不一致的情况。
所以，「先更新数据库 + 再删除缓存」的方案，是可以保证数据一致性的。
而且阿旺为了确保万无一失，还给缓存数据加上了「过期时间」，就算在这期间存在缓存数据不一致，有过期时间来兜底，这样也能达到最终一致。
阿旺思考到这一步后，觉得自己真的是个小天才，因为他竟然想到了个「天衣无缝」的方案，他二话不说就采用了这个方案，又经过几天的折腾，终于完成了。

还有bug？

他自信满满的向老板汇报，已经解决了上次客户的投诉的问题了。老板觉得阿旺这小伙子不错，这么快就解决问题了，然后让阿旺在观察几天。
事情哪有这么顺利呢？结果又没过多久，老板又收到客户的投诉了，说自己明明更新了数据，但是数据要过一段时间才生效，客户接受不了。
老板面无表情的找上阿旺，让阿旺尽快查出问题。

bug原因

阿旺得知又有 Bug 就更慌了，立马就登录服务器去排查问题，查看日志后得知了原因。
「先更新数据库，再删除缓存」其实是两个操作，前面的所有分析都是建立在这两个操作都能同时执行成功，而这次客户投诉的问题就在于，在删除缓存（第二个操作）的时候失败了，导致缓存中的数据是旧值。
好在之前给缓存加上了过期时间，所以才会出现客户说的过一段时间才更新生效的现象，假设如果没有这个过期时间的兜底，那后续的请求读到的就会一直是缓存中的旧数据，这样问题就更大了。
所以新的问题来了，如何保证「先更新数据库，再删除缓存」这两个操作能执行成功？
阿旺分析出问题后，慌慌张张的向老板汇报了问题。
老板知道事情后，又给了阿旺几天来解决这个问题，画饼的事情这次没有再提了。
阿旺会用什么方式来解决这个问题呢？
老板画的饼事情，能否兑现给阿旺呢？
预知后事，且听下回阿旺的故事。

更新缓存 > 删除缓存？(改善命中率)

这里继续说点其他。

「先更新数据库，再删除缓存」的方案虽然保证了数据库与缓存的数据一致性。但是每次更新数据的时候，缓存的数据都会被删除，这样会对缓存的命中率带来影响。

所以，如果我们的业务对缓存命中率有很高的要求，我们可以采用「更新数据库 + 更新缓存」的方案，因为更新缓存并不会出现缓存未命中的情况。

但是这个方案前面我们也分析过，在两个更新请求并发执行的时候，会出现数据不一致的问题，因为更新数据库和更新缓存这两个操作是独立的，而我们又没有对操作做任何并发控制，那么当两个线程并发更新它们的话，就会因为写入顺序的不同造成数据的不一致。

所以我们得增加一些手段来解决这个问题，这里提供两种做法：

在更新缓存前先加个分布式锁，保证同一时间只运行一个请求更新缓存，就会不会产生并发问题了，当然引入了锁后，对于写入的性能就会带来影响。
在更新完缓存时，给缓存加上较短的过期时间，这样即时出现缓存不一致的情况，缓存的数据也会很快过期，对业务还是能接受的。

对了，针对「先删除缓存，再更新数据库」方案在「读 + 写」并发请求而造成缓存不一致的解决办法是「延迟双删」。

延迟双删实现的伪代码如下：

#删除缓存
redis.delKey(X)
#更新数据库
db.update(X)
#睡眠
Thread.sleep(N)
#再删除缓存
redis.delKey(X)

加了个睡眠时间，主要是为了确保请求 A 在睡眠的时候，请求 B 能够在这这一段时间完成「从数据库读取数据，再把缺失的缓存写入缓存」的操作，然后请求 A 睡眠完，再删除缓存。

所以，请求 A 的睡眠时间就需要大于请求 B 「从数据库读取数据 + 写入缓存」的时间。

但是具体睡眠多久其实是个玄学，很难评估出来，所以这个方案也只是尽可能保证一致性而已，极端情况下，依然也会出现缓存不一致的现象。

因此，还是比较建议用「先更新数据库，再删除缓存」的方案。

删除缓存 > 更新缓存？(一般而言更好)

Note

为什么是删除缓存，而不是更新缓存呢？

删除一个数据，相比更新一个数据更加轻量级，出问题的概率更小。
在实际业务中，缓存的数据可能不是直接来自数据库表，可能来自多张底层数据表的聚合。
比如商品详情信息，在底层可能会关联商品表、价格表、库存表等。如果更新了一个价格字段，那么就要更新整个数据库，还要关联的去查询和汇总各个周边业务系统的数据，这个操作会非常耗时。
不是所有的缓存数据都是频繁访问的，更新后的缓存可能会长时间不被访问。
所以说，从计算资源和整体性能的考虑，更新的时候删除缓存，等到下次查询命中再填充缓存，是一个更好的方案。
系统设计中有一个思想叫 Lazy Loading (懒加载)，适用于那些加载代价大的操作，删除缓存而不是更新缓存，就是懒加载思想的一个应用。

改进：保证两个操作都能执行成功

复习一下，之前的问题在于：在删除缓存（第二个操作）的时候失败了，导致缓存中的数据是旧值，而数据库是最新值。

举个例子：

应用要把数据 X 的值从 1 更新为 2，先成功更新了数据库，然后在 Redis 缓存中删除 X 的缓存，但是这个操作却失败了，这个时候数据库中 X 的新值为 2，Redis 中的 X 的缓存值为 1，出现了数据库和缓存数据不一致的问题。

那么，后续有访问数据 X 的请求，会先在 Redis 中查询，因为缓存并没有诶删除，所以会缓存命中，但是读到的却是旧值 1。

其实不管是先操作数据库，还是先操作缓存，只要第二个操作失败都会出现数据一致的问题。

所以问题在于：如何保证「先更新数据库，再删除缓存」这两个操作能执行成功？

有两种解决方法：

消息队列的重试机制
订阅 MySQL binlog，再操作缓存

这两种方法有一个共同的特点，都是采用异步操作缓存

方法一：消息队列的重试机制

先来说第一种。

我们可以引入消息队列，将第二个操作（删除缓存）要操作的数据加入到消息队列，由消费者来操作数据。

如果删除缓存失败：可以从消息队列中重新读取数据，然后再次删除缓存，这个就是重试机制。当然，如果重试超过的一定次数，还是没有成功，我们就需要向业务层发送报错信息了。
如果删除缓存成功：就要把数据从消息队列中移除，避免重复操作，否则就继续重试。

举个例子，来说明重试机制的过程。

方法二：订阅 MySQL binlog，再操作缓存

「先更新数据库，再删缓存」的策略的第一步是更新数据库，那么更新数据库成功，就会产生一条变更日志，记录在 binlog 里。

于是我们就可以通过订阅 binlog 日志，拿到具体要操作的数据，然后再执行缓存删除。
（落地：阿里巴巴开源的 Canal 中间件就是基于这个实现的）

Canal 模拟 MySQL 主从复制的交互协议，把自己伪装成一个 MySQL 的从节点，向 MySQL 主节点发送 dump 请求，MySQL 收到请求后，就会开始推送 Binlog 给 Canal，Canal 解析 Binlog 字节流之后，转换为便于读取的结构化数据，供下游程序订阅使用。

下图是 Canal 的工作原理：

其他：个人的一个疑问

我记得MySQL是有Server层和存储引擎层的，在Server层中自己也有缓存。为什么非得自己用Redis去多做这么一个缓存呢？

Note

GPT：MySQL确实有自己的Server层缓存和存储引擎层缓存，那为什么还要额外引入Redis作为缓存呢？这是一个很好的问题，让我们来深入探讨一下。

MySQL内部缓存的局限性
- 缓存容量有限： MySQL的缓存容量通常是有限的，而且受限于服务器的内存大小。对于高并发、大数据量的应用场景，MySQL的缓存可能很快就被填满，无法满足需求。
- 缓存粒度较粗： MySQL的缓存通常是针对查询结果集的，缓存粒度相对较粗。对于频繁查询的单个字段或小部分数据，MySQL的缓存效率不高。
- 缓存淘汰策略单一： MySQL的缓存淘汰策略相对简单，通常采用LRU（Least Recently Used）算法。对于一些特定的业务场景，LRU算法可能不是最优的选择。
- 缓存管理复杂： MySQL的缓存配置和管理相对复杂，需要对MySQL的内部机制有深入的了解。
Redis作为缓存的优势
- 高性能： Redis是一个专门为缓存设计的数据库，它的性能远高于MySQL。Redis支持多种数据结构，可以满足各种缓存需求。
- 高并发： Redis是单线程模型，但采用了IO多路复用机制，可以处理高并发请求。
- 灵活的数据结构： Redis支持多种数据结构，如字符串、哈希、列表、集合、有序集合等，可以灵活地存储各种类型的数据。
- 丰富的功能： Redis提供了丰富的功能，如过期设置、持久化、发布订阅等，可以满足复杂的缓存需求。
- 易于管理： Redis的配置和管理非常简单，可以通过命令行或客户端工具进行操作。
为什么需要MySQL和Redis共同使用
- 分层缓存： 可以将MySQL的缓存作为一级缓存，Redis作为二级缓存。这样可以充分利用MySQL的缓存，同时提高缓存的命中率。
- 热点数据缓存： 将频繁访问的热点数据缓存到Redis中，可以大大减轻MySQL的压力。
- 读写分离： 将读操作全部交给Redis处理，写操作则直接写入MySQL，可以有效地提高系统的读性能。
- 数据一致性： 可以通过一些机制来保证MySQL和Redis之间的数据一致性，例如缓存穿透、缓存雪崩等问题的解决。

总结

虽然MySQL有自己的缓存机制，但Redis作为专门的缓存数据库，在性能、灵活性和易用性方面具有明显的优势。通过将MySQL和Redis结合使用，可以构建一个高效、灵活的缓存系统，满足各种复杂的应用场景。

何时考虑使用Redis

高并发读操作： 如果你的应用存在大量读操作，并且对响应时间要求较高，那么Redis是一个不错的选择。
热点数据查询： 如果你的应用存在一些热点数据，被频繁查询，那么将这些数据缓存到Redis中可以大大提高查询性能。
复杂的数据结构： 如果你的缓存数据结构比较复杂，MySQL的缓存可能无法满足你的需求，而Redis提供了丰富的支持。

需要注意的问题

数据一致性： MySQL和Redis之间的数据一致性问题需要谨慎处理，需要选择合适的缓存更新策略。
缓存穿透、缓存雪崩： 需要采取相应的措施来防止缓存穿透和缓存雪崩问题。
成本： Redis的部署和维护需要一定的成本，需要根据实际需求进行评估。

总之，MySQL和Redis是互补的关系，而不是替代关系。通过合理地结合使用两者，可以构建一个高效、可靠的缓存系统。

希望这个回答能帮助你更好地理解MySQL和Redis之间的关系。

链接到当前文件 0

没有文件链接到当前文件