1.4**关系模型和关系运算 **
n 基本概述
关系数据库是应用关系数据模型来建立和处理数据库中的数据。这其中主要涉及几个重要的概念。
u 关系
关系实际上就可以看作是一个二维表。其中,表的每一列称为属性,并用属性名来标识。每个属性的取值范围,就是该属性所对应的值域。表的每一行称为元组。约定该表的行、列的次序的改变,不改变关系的语义性质。
对于一个关系,应该具备下列性质:
Ø 关系中每一个属性值都是不可分解的;
Ø 关系中不允许出现相同的元组;不让用户考虑元组的顺序;
Ø 用户在使用时应考虑列的顺序。
u 关系模型
关系模型是目前最流行的一种数据模型,它是用二维表格结构表示实体集,关键码表示实体间的联系。
u 关键字(键)
I. 候选键
关系中的某一属性或属性组,若它的值可以唯一标识关系中的一个元组而又不含有多余的属性,则称该属性或属性组为候选关键字。
II. 主键
关系模式中用户正使用的候选关键字称为主关键字。
III. 外关键字
若模式R中某属性集是其他模式的候选键,那么该属性集对模式R而言就是外关键字。
IV. 超键
关系模式中,为唯一标识元组的属性集称为超键。
u 关系模型
关系模型遵循数据库的3级体系结构。
u 关系模式
数据库的概念模式定义为关系模式的集合。每个关系模式就是记录类型。
u 关系子模式
这是对用户所用到的那部分数据的描述。除了指出用户用到的数据外,还应指出数据与模式中相应数据的联系,即指出子模式与模式之间的对应性。
u 关系存储模式(关系内模式)
这是作为文件看待的,每个元组就是一个记录。
关系模型有3个部分构成:
u 数据结构
关系模型采用的数据结构是关系。
u 关系操作
关系模型提供一组完备的关系运算,以支持对数据库的各种操作。关系运算的理论是关系代数和关系演算。
u 关系的完整性
在关系模型中,数据的约束条件通过三类完整性约束条件来描述。即:
I. 实体完整性
要求关系中的元组的主键值不能是空值。
II. 参照完整性
要求在关系中不允许引用不存在的实体。
III. 用户定义的完整性
这是针对某一具体数据的约束条件,由应用环境决定,例如属性的值限制。
n 关系代数
关系查询语言根据其理论基础的不同分成两大类:
u 关系代数语言:查询操作是以集合操作为基础的运算。
u 关系演算语言:查询操作是以谓词演算为基础的运算。
其中,关系代数是以集合代数为基础发展起来的,它是以关系为运算对象的一组高级运算的集合。关系代数的运算可分为两类:
基本运算操作:并、差、笛卡尔积、投影和选择。
组合运算操作:交、联接、自然联接和除。
另外,还有几种扩充的关系代数操作:外联接(左外联接和右外联接)、外部并和半联接。
以下对几种常用的关系运算作一个简单的介绍。
u 基本运算
- 并
设有两个关系R和S具有相同的关系模式,关系R和S的并是由属于R或属于S的元组组成的集合,记为R∪S。形式定义如下:R∪S≡{t│t∈R∨t∈S}
- 差
设有两个关系R和S具有相同的关系模式,关系R和S的差是由属于R但不属于S的元组组成的集合,记为R-S。形式定义如下:R-S≡{t│t∈R∧t ̄∈S}
- 笛卡儿积
设关系R和S元数分别为r和s。定义R和S的笛卡儿积是一个(r+s)元的元组集合,每个元组的前r个分量来自R的一个元组,后s个分量来自S的一个元组,记为R×S形式定义如下:R×S≡{t│t=<tr,ts>tr∈R∧ts∈S}
若R有m个元组,S有n个元组,则R×S有(mn)个元组。
- 投影
该操作是对关系进行垂直分割,消去某些列,并重新安排列的顺序,再删去重复元组。
- 选择
这个操作是根据某些条件对关系作水平分割,即选择符合条件的元组。条件可用命题公式F表示,F中的运算对象是常数(用引号括起来)或元组分量(属性名或列的序号)。运算符有算术比较运算符(≤,<,≥,>,=,≠)和逻辑运算符(∧,∨,┐)。
δF(R)≡{t│t∈R∧F(t)= true}
δ为选择运算符,δF(R)表示从R中挑选满足公式F的元组所构成的集合。常量用引号括起来,而属性号或属性名不要用引号括起来。
u 组合运算
- 交
设有两个关系R和S具有相同的关系模式,关系R和S的交是由属于R又属于S的元组组成的集合,记为R∩S。形式定义如下:R∩S≡{t│t∈R∧t∈S}
- 联接(又称θ联接)
从关系R和S的笛卡尔积中选取属性值之间满足一定条件的元组 ,记为:
R│×│S≡δiθ(i+j)(R×S) ijθ
这里R的元数是r,θ是算术比较运算符。R│×│S操作是在R和S ijθ的笛卡尔积中挑选第i个分量和第(r+j)个分量满足θ运算的元组组成的新的关系。
- 自然联接
两个关系R和S的自然联接用R│×│S表示,具体计算过程如下:
A) 计算R×S
B) 设R和S的公共属性是A1,A2,A3,..Ak.,挑选R×S中满足R.A1=S.A1,R.A2,…,R.Ak=S.Ak的那些元组
C) 去掉S.A1,S.A2,..S.Ak
R│×│S可用下列形式定义:
R│×│S≡πi1i2,…,im(δR.A1=S.A1∧…∧R.Ak=S.Ak(R×S)。
- 除法
设两个关系R和S的元数分别为r和s(r>s>0),那么R÷S是一个(r-s)元的元组的集合。(R÷S)是满足下列条件的最大关系,其中每个元组t与S中每个元组u组成的新元组<t,u>必在关系R中。
R÷S的具体计算过程如下:
A) T=π1,2,..r-s(R)
B) W=(T×S)-R求出T×S中不在R的元组
C) V=π1,2,…r-s(W)
D) R÷S=T-V
因此R÷S≡π1,2,..r-s (R)- π1,2,..r-s ((π1,2,..r-s (R) ×S) -R )。