数据库的模式一般用某种数据定义语言描述。实际上,他一定是用某个具体的 DBMS 的数据定义语言编写的。遗憾的是,这类语言太低级,用其描述一个组织机构的数据需求不易被各类用户广泛理解。为此,我们需要更高层次的模式描述,也就是 数据模型。
-
数据模型:一组集成的概念,用于描述和操纵组织机构内的数据、数据间联系以及对数据的约束。
模型是 “现实世界” 中对象和事件及其关联的表示。它集中抽象了一个组织机构内本质的东西,而忽略其非本质的特性。一个数据模型刻画一个组织。它应该提供基本的概念和表示方法,使得数据库设计人员和终端用户能明白无误的交流他们对组织内数据的理解。数据模型含下列三个组件:- 结构部分:由一组创建数据库的规则组成。
- 操纵部分:定义允许对数据进行的操作的种类(包括更新和检索数据库中的数据,以及修改数据库结构)。
- 一组完整性约束:确保数据的准确性。
前面讨论了关系数据模型的结构。下面将继续讨论关系的完整性规则。我们前面提到过:由于每个属性都具有一个关联的域,因此就存在这样一条限制,称为 域约束(domain constraint),限定了关系中各个属性的取值集合。此外,还有两个重要的 完整性规则,它们适用于数据库中的所有实例。关系模型的这两条主要规则就是 实体完整性(entity integrity) 和 **引用完整性(referential integrity)。其他的完整性约束还有 **多样性(multiplicity)和 一般性约束(general constraint)。在定义实体完整性和引用完整性之前,必须对 空(null) 的概念有所了解。
1. 空
-
空(null):代表对一个元组当前取值还不知道或是不可用的属性值。
空可以表示 “不知道” 这个逻辑值。它还可以指对于某个特定元组无值可用,或者它仅仅意味着尚未提供任何值。空是处理不完整数据或异常数据的一种方法。但空不等于零值或空格所组成的字符串。零值和空格都是实际存在的值,而空则表示没有这么一个值。因此应该将空与其他值区别对待。一些人使用了 “空值” 这个术语,但因为空并不是一个值,只是没有值的一种表示,因此并不推荐使用 “空值” 这个词。例如在前面的 Viewing 关系中,comment 属性在租户参观房产并向业主反馈评论之前都是未定义的。如果没有空这个概念,就需要引进一个默认值来代表这种状态,或是添加一些对用户来说毫无意义的额外属性。在这里可以试着用 “-1” 这个值来代表空评论。当然也可以给 Viewing 关系加入一个新的 hasCommentBeenSupplied 属性,如果给出了评论,这个值为 Y,反之为 N。这两种方法都会给用户带来混乱。
空可能会导致执行问题,因为关系模型是基于一阶谓词演算的,谓词演算是二值逻辑,或称布尔逻辑,因此只允许两个值的存在,或为真,或为假。允许空存在意味着,必须采用一种多值逻辑,例如三值或四值逻辑(Codd,1986,1987,1990)
在关系模型中使用空一直是个有争议的问题。Codd 将空看成模型中一个不可分割的部分(Codd,1990),而一些人则认为这种方法易产生误导,他们相信人们没有充分理解丢失信息的问题,从而无法找到一个满意的解决方案,因此,将空引入关系模型亦属草率(比如见,Date,1995)。
下面给出两条关系完整性规则的定义。
2. 实体完整性
第一条完整性约束针对基本关系的主关键字。在这里,将基本关系定义为与概念模式中某个实体相对应的一个关系。
-
实体完整性:在基本关系中,主关键字的属性不能为空。
根据定义,主关键字是能对元组进行唯一标示的最小标识符。这就意味着主关键字的任何子集都不足以唯一标识元组。如果允许主关键字的某个部分为空,这就暗示了并不是所有属性都是标识元组所必需的,与主关键字的定义相矛盾。如果对这条规则进行详细的分析,就会发现一些奇怪的地方。第一,既然候选关键字同样也可以唯一的标识元组,为什么这条规则只用在主关键字上,而没有更一般的推广到候选关键字中?第二,为什么这条规则只对基本关系起约束作用?例如,在前面的 Viewing 关系中,如果有一个查询要求列出查看记录中的所有评论。这个查询将会生成一个由属性 comment 组成的一元关系。根据定义,这个属性就是结果关系的主关键字,但它包含了空。因为这个关系不是一个基本关系,所以模型允许主关键字为空。基于这些不合理的地方,现在有一些人试图对这条规则进行重新定义(例如,Codd,1988;Date,1990)。
3. 引用完整性
第二条完整性规则是针对外部关键字的。
-
引用完整性:如果在关系中存在某个外部关键字,则它的值或与主关系中某个元组的候选关键字取值相等,或者全为空。
例如,关系 Staff 中的 branchNo 指向主关系 Branch 中的 branchNo 属性。那么他就不能创建出一个分公司编号为 B025 的员工记录,除非在 Branch 关系中已经有了分公司编号为 B025 的记录。但是,可以创建一条分公司编号为空的新员工记录,用来表示公司加入了一名新员工,但他还没被分配到某个特定的分公司中。
4. 一般性约束
-
一般性约束:由数据库用户或数据库管理员所指定的附加规则,它约束企业的某些方面。
还可以让用户来指定数据所需满足的附加约束。例如,如果在一个分公司中工作的人数不能超过20位这个上限,那么用户就可以说明这个一般性约束,并由 DBMS 来强制执行。