『数据与信息』
数据:
描述客观事物特征或性质的某种符号(符号可以是数值、文字、图形、图像、声音等形式),它们都可以经过数字化处理后存入计算机。
数据项:
数据的基本单元,即最小单位,每个数据项都有一个数据项名和若干可能的数据项值。
记录型:
描述一类事物的若干特征或性质的数据项名的集合,即数据结构。
【描述某校所有学生的记录型】
姓名、性别、出生日期、籍贯、所在系别、 入学日期
数据记录:
按照记录型的规定描述一个事物的若干特征或性质的数据项值的集合。
【描述一个学生李明的记录】
李明,男,21,1972/08/21,江苏,计算机系,1990/09/01
数据处理:
对数据进行各种 "数学运算和统计加工" 的过程总和。
信息:
数据处理的结果,且仍以数据的形式表示。
『数据独立性』
数据的物理独立性:
当数据的物理存储位置改变时,用户的应用程序不用改变。
数据的逻辑独立性:
即当数据的逻辑结构改变时(如在表中添加两个属性),用户的应用程序不用改变。
『数据库系统(DBS)』
是计算机系统、DB(长期存储在计算机内的、有组织的、可共享的数据集合)、DBMS(人们能通过DBMS建立数据库,对数据库中的数据进行组织、存取和维护管理,是一种数据管理软件)、应用软件、DBA和用户的总和,一般由硬件、软件、数据库、数据库管理员和用户构成。
『数据模型的构成』
定义:
对现实世界客观事物的数据抽象描述,确切地反映事物、事物的特征和事物之间的联系。
数据模型的静态特性:
数据结构,对计算机的数据组织方式和数据之间的联系进行框架性描述的集合。
【例如:学生记录型,学生(姓名、性别、出生日期、出生地、所在学院等)就是一种数据结构】
在数据库系统中,通常按照数据结构的类型来命名数据模型。(关系结构——关系模型)
数据模型的动态特性:
数据操作,对数据库中各种对象类的实例(或取值)所允许执行的操作的集合,包括操作的语义、操作符号、操作规则(如优先级)以及实现操作的语言等。关系数据模型的操作方式为一次一集合,非关系数据模型的操作方式为一次一记录。
数据模型的完整性约束条件:
关于数据状态和状态变化的一组完整性约束条件(即"规则"由数据模型本身的特点决定,也可以由用户自定义完整性)的集合。它保证数据的正确性、有效性和相容性。
【例如:学分属性列不能为负数,不及格课程数不得超过三门】
『数据模型的分类』
概念数据模型:
它与具体的DBMS无关,是数据库设计员与用户之间进行交流的语言,常用的概念数据模型是实体–联系模型,简称E-R模型。
结构数据模型 / 逻辑数据模型:
用户从数据库中所看到的数据模型,是具体的DBMS所支持的数据模型,如网状数据模型、层次数据模型、关系数据模型和面向对象的数据模型。
物理数据模型:
描述数据在存储介质上组织结构的数据模型。
每一种结构数据模型在实现时都有其对应的物理数据模型。
DBMS自动完成大部分物理数据模型的实现工作,设计者只需设计索引、聚集等特殊结构。
『实体-联系(E-R)模型』
域:
属性的取值范围称为该属性的域。
关键字:
能唯一地标识实体集中每个实体的属性集合称为关键字。
联系:
可以分为实体集内部的联系和实体集之间的联系。矩形表示实体集,菱形表示联系,圆形表示属性。
可以分为一对一联系、一对多联系和多对多联系。
【例:"主任"属性——编号,姓名,年龄,学历; "系"属性——系编号,系名。主任和系之间是一个管理关系,并反映出任职时间】
『结构数据模型』
层次模型(非关系模型)
条件:有且只有一个结点没有双亲结点,这个结点称为根结点;除根结点以外的其它结点有且只有一个双亲结点与之相连。每一个节点表示一个实体型(集),也称记录型(集)。
优点:适用于实体间联系固定且预先定义好的应用系统。
缺点:只能表示1:n的一对多联系,多对多联系表示起来较为复杂;树形结构的层次顺序严格且复杂。
网状模型(非关系模型)
条件:允许一个以上的节点无双亲,一个节点允许两个或两个以上的双亲,实际上没有双亲结点和子女节点的概念;
允许有复合联系,两个实体之间可以有两种或两种以上的联系,也包括实体集自身到自身的两种或多种联系(层次模型不允许)。
每一个节点仍表示一个实体型(集),也称记录型(集)。
缺点:结构和DDL,DML语言复杂,用户不容易使用。
关系模型
关系模式:对应一个二维表的表头,它对应E-R模型中的实体型。
关系:对应一张二维表,它与E-R模型中的实体集对应。
属性:二维表中的一列即为一个属性,给每一个属性起一个名称即属性名。与E-R模型中实体型属性相同。
候选键:二维表中的某些属性 的集合,它可以唯一确定一个元组。与E-R模型中的关键字对应。
分量:元组中一个属性所取的具体值。
关系模式与元组的关系:关系模式是对同类实体特征的结构化数据描述,是一个相对稳定的结构框架;元组是关系模式的一次具体赋值,是动态变化的。
优点:建立在严格的数学理论基础上;
实体和实体之间的联系都用关系表示;
存取路径对用户透明,有更高的数据独立性、更好的安全保密性;
数据操作是集合操作,即操作的对象和操作的结果都用关系表示。
缺点:查询效率往往不如非关系数据模型。
『数据库系统模式』
数据库中全体数据的特征及其联系的结构化描述,模式的一个具体值称为模式的一个实例。
『数据库的三级模式』
模式:
也称结构模式或逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,与结构数据模型对应,DBMS提供模式定义语言(Schema DDL,简称模式DDL)来严格地定义模式。
【对应于SQL Server 中用CREATE TABLE创建基本表】
外模式:
也称子模式或用户模式,它是数据库用户能够看见和使用的,与某一具体应用有关的局部数据的逻辑结构和特征的描述。针对不同的用户,即使是相同模式的数据,也可以产生不同的外模式。
【对应于SQL Server 中用CREATE VIEW创建视图】
内模式:
也称存储模式,是数据库物理结构和存储方式的描述,是数据在数据库内部的表示方式。
【对应于存储文件】
『数据库的二级映像功能』
外模式/模式映像(不唯一):
存在于外模式与模式之间,在外模式中描述定义外模式与模式之间的对应关系。由于应用程序依据数据的外模式编写,当模式改变时应用程序也不必修改,保证了数据的逻辑独立性。
模式/内模式映像(唯一):
存在于模式与内模式之间,在内模式中描述定义内模式与模式之间的对应关系,即数据库全局逻辑结构与存储结构之间的对应关系。当数据库的存储结构更改或改变数据的存储位置时,模式和应用程序不必改动,保证了物理独立性。
『数据库的功能』
定义功能:
DBMS通过提供数据定义语言DDL来对外模式、模式和内模式加以描述和定义,即定义数据库的逻辑结构、存储结构、语义信息和保密要求等。
操纵功能:
DBMS提供数据操纵语言DML实现对数据库中数据的基本操作,如检索、插入、修改、删除和排序等等。DML分为嵌入式和非嵌入式两类。
控制功能:
控制整个数据库系统的运行,包括安全性保护、 并发控制、存取控制(完整性约束条件检查)等。
维护功能:
包括初始数据的装入、数据库的转储或后备功能、数据库恢复功能、数据库的重组织功能以及性能分析等功能。