数据:用于描述事物的符号记录,数据与其语义是不可分的
数据库:是长期存储在计算机内的、有组织的、可共享的数据集合
数据库系统:是计算机系统引入数据库后的一个系统,由数据库、数据库管理系统、应用系统、管理员、用户【五个部分】组成。数据库系统的核心是数据库管理系统,基础是数据模型。数据库具有数据结构化、共享性高、冗余度低、易扩充的特点
数据库管理系统:是位于用户与操作系统之间的一层系统,用于高效地定义、存取、运行管理、建立维护数据。常见的有Oracle公司的mysql,Microsoft公司的SQL Sever
数据模型:是数据特征的抽象,通常由数据结构、数据操作和完整性约束三部分组成。在数据库中主要有三中数据模型:层次数据模型、网状数据模型、关系数据模型。
关系模型:关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。通常,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。
关系:一个关系对应通常说的一张表
属性:表中的一列即为一个属性
域:属性的取值范围
元组:表中的一行即为一个元组
码:表中的某个属性组,它可以唯一确定一个元组
候选码:若属性/属性组K决定(函数依赖)了关系R(可以唯一确定一个元组),那么称 K 为 R 的候选码
分量:元组中的一个属性值
关系模式:对关系的描述,一般为:关系名(属性1, 属性2,..., 属性n)
数据库中的三级模式结构:外模式(也称用户模式,可看见当前使用的局部数据的逻辑结构)、模式(也称逻辑
模式,是数据库中全体数据的逻辑结构和特征的描述)、内模式(也称存储模式,是数据在数据库系统内部的表示)
数据独立性:数据独立性包括数据的物理独立性与数据的逻辑独立性。数据库管理系统的模式结构和二级映像功能保证了数据具有很高的物理独立性与逻辑独立性
模式:是数据库中全体数据的逻辑结构和特征的描述
外模式:数据的局部逻辑结构,通常是模式的子集
内模式:也称存储模式,是数据在数据库系统内部的表示,即数据的物理结构和存储方式的描述
数据定义语言:DDL,用于定义数据库模式、外模式、内模式的语言
数据库操纵语言:DML,用来对数据库中的数据进行查询、插入、删除和修改的语句
数据与程序的逻辑独立性:当模式改变时(比如增加新的关系、改变属性时),由数据库管理员对外模式/模式的映像做出改变,而使得外模式不变。
数据与程序的物理独立性:当数据库的存储结构改变时,由数据库管理员对模式/内模式映像做出相应改变,从而使得模式保持不变,从而应用程序也不必改变。
实体完整性:用于保证数据库中数据表的每一个特定实体的记录都是唯一的
域完整性:用于保证制定列具有正确的数据类型、格式与有效的范围
参照完整性:当增加、修改、删除表中记录时,可以借助参照完整性保证表之间数据的一致性
用户定义完整性:用户可以定义不属于以上三种完整性的规则
笛卡尔积:通俗点说就是指包含两个集合中任意取出两个元素构成的组合的集合
基本表:基本表是本身独立存在的表,在 sql 中一个关系就对应一张表
视图:是从一个或几个基本表导出的表,视图本身不独立存储在数据库中,是一个虚表。若视图的属性来自集合函数、表达式,则该视图肯定是不可以更新的。
触发器:是 SQL Sever 上数据库管理员为了保证数据完整性的办法
索引:创建在数据库表上,其作用是提高对表中数据的查询程度。语法为: 操作(如DROP) INDEX 索引名 ON 表名
规范化的判断:
1.第一范式(1NF):列不可再分
1. 第二范式(2NF):非主属性(不在候选码中的属性)完全依赖于主属性(候选码中的属性)
2. 3NF:非主属性对主属性无传递依赖
e.g 比如 R(A,B,C,D,E),若A->B,BC->D,DE->A,则R的所有码为:ACE,BCE,DCE,其中A、B、C、D、E都是候选码中的属性,它们都是主属性,所以不存在非主属性对主属性的传递依赖的问题,所以R是3NF。但是由于主属性之间有依赖关系,所以R并不是BCNF。
3. BCNF:。主属性之间无依赖关系 (首先需要确定候选码)
【快速判断BCNF的技巧:决定因素必须是候选码,非主属性对主属性无传递依赖,主属性之间无依赖关系】
e.g. 比如 R(A,B,C,D,E),若A是候选码,且BC->DE,则当BC是候选码时,R是BCNF
设计数据库的步骤:
1.需求分析阶段:分析用户的业务和数据需求
2.概要设计阶段:绘制数据库的E-R图(Entity-Relationship Graph),要求确定信息的正确性与完整性
3.详细设计阶段:将E-R图转化为多张表,确定表与表之间的逻辑关系(主键、外键),并应用规范化