CAP组合方式
- 上边商品管理的例子是否同时具备CAP呢?
- 在所有分布式事务中不会同时具备CAP三个特性,因为在具备了C和A是不能共存的。
- 比如:
-
下图满足了P即表示实现分区容错:
- 本图分区容错的含义是:
- 1.主数据库通过网络向从数据同步数据,可以认为主数据库部署在不同的分区,通过网络进行交互。
- 2.当主数据库和从数据库之间的网络出现问题不影响主数据库和从数据库对外提供服务。
- 3.其一个结点挂掉不影响另一个结点对外提供服务。
如果要实现C则必须要保证数据一致性,在数据同步的时候为防止向从数据库查询不一致的数据则需要将从数据库数据锁定,待同步完成后解锁,如果同步失败从数据库要返回错误信息或超时信息。
如果要实现A则必须保证数据可用性,不管任何时候都可以从数据查询数据,则不会响应超时或返回错误信息。
通过分析发现在满足P的前提下C和A存在矛盾性。
CAP有哪些组合方式呢?
- 所以在生产中对分布式事务处理时要根据需求来确定满足CAP的哪两个方面。
AP:
- 放弃一致性,追求分区容错性和可以性。这是很多分布式系统设计时的选择。
- 例如:
- 上边的商品管理,完全可以实现AP,前提是只要用户可以接收所有查询的到数据在一定时间内不是最新的即可。
- 通过实现AP都会保证最终一致性,后面讲的BAST理论就是根据AP来扩展的,一些业务场景比如:订单退款,今日退款成功,明日账户到账,只要用户可以接受在一定时间内到账即可。
CP
- 放弃可用性,追求一致性和分区容错性,我们的zookeeper其实就是追求的强一致性,又比如跨行转账,一次转账请求要等待双方银行系统都完成整个事务才算完成
CA
- 放弃分区容错性,即不进行分区,不考虑由于网络不通或结点挂掉的问题,则可以实现一致性和可用性。那么系统将不是一个标准的分布式系统。我们最常的关系型数据库就满足了CA。
-
上边的商品管理,如果要实现CA架构如下:
- 主数据库和从数据库中间不再进行数据同步,数据库可以响应每次的查询请求,通过事务隔离级别实现每个查询请求都可以返回最新的数据。
总结
- 通过上面我们已经学习了CAP理论的相关知识,CAP是一个已经被证实的理论:一个分布式系统最多只能同时满足一致性(Consistency),可用性(Availability)和分区容错性(Partition tolerance)这三项中的两项。它可以作为我们进行架构设计,技术选型的考量标准。对于大多数大型互联网应用的场景,结点众多,部署分散,而且现在的集群规模越来越大,所以节点故障,网络故障是常态,而且要保证服务可用性达到N个9(99.99...%),并要达到良好的响应性能来提高用户体验,因此一般都会做出如下选择:保证P和A,舍弃C强一致,保证保证最终一致性。