原文
Linearizability和Serializability是在数据库和分布式系统中重要的两个概念,而且比较容易混淆,这篇文章试着对两个概念的不同进行简单、简短的解释。
Linearizability: single-operation, single-object, real-time order
Linearizability:单操作,单对象,实时顺序。
*Linearizability *是对单对象单操作的一种保证。它提供了对于同一个对象的一系列read/write操作都是按照实时时间(例如wall-clock))排序的。
Linearizability保证对于一个对象的写操作,一旦写完成,需要立即马上被后续的读操作看到:即读一定是读到这个对象的最新的值。
Linearizability是“atomic consistency”的同义词,同时也是CAP种的C,“consistency”。
并且Linearizability是可组合的,如果系统中每个对象的操作都是linearizable,则系统中所有操作是linearizable。
Serializability: multi-operation, multi-object, arbitrary total order
Serializability:多个操作,多个对象,任意的顺序
Serializability是对事务的一种保证。Serializability保证了多个事务(每个都包含了一组对于不同对象的读/写操作)的执行等同于一个顺序执行的效果。
Serializability是ACID中的I。如果每个事务都保证了correctness(ACID中的C),则顺序执行的事务也保证了correctness,因此serializability是保证事务正确的一个机制。
Serializability和linearizability的不同是:Serializability没有对事务的执行顺序强加任何real-time的约束,即不需要操作是按照真实时间严格排序的,只需要存在一个满足条件的顺序执行顺序即可,不需要每个事务都是严格的先后时间顺序。
Strict Serializability: Why don’t we have both?
严格的Serializability:我们为什么两者都要?
serializability + linearizability = strict serializability
我们假设开始并提交T1:写item x,然后稍后开始提交T2:读x。数据库如果按照strict serializability,则会将T1放到T2之前,T2会读到x的最新值,如果数据库按照serializability,则可能会将T2放到T1之前,
Coordination costs and real-world deployments
linearizability 或者 serializability在没有协调的情况下都不可能达到,因此我们在异步网络和可用性不能提供linearizability 或者 serializability的保证。
A note on terminology, and more reading
linearizability来源于分布式系统和并发编程,而serializability则来源于数据库。如今这两者都在分布式系统和数据库中使用,也导致了术语上的冲突。
一些参考
Introduction to Reliable and Secure Distributed Programming
CSC 2/458, 4-11 Feb. 2008