一、设计数据库时所依据的共有三个范式
1、第一范式:要求有主键,数据库中不能出现重复记录,每一个字段是原子性不可再分的
实例:
分析以上出现的问题:
①数据存在重复记录,没有主键,数据不唯一
②联系方式还可以再分,不是原子性
修改之后的:
总结第一范式:
①每一行必须唯一,必须有主键,这是设计数据库的最基本的要求
②主键通常采用数值型(int/bigint)或者定常字符串(自己写的方法来实现)来表示
③关于列不可再分,需要根据实际情况具体分析,如联系方式,为了开放上的遍历就可能采用一个字段了
2、第二范式:是建立在第一范式的基础之上的,非主键字段完全依赖主键,不能部分依赖,严格意义上说就是:尽量避免使用联合主键
实例:
示例1、数据仍然可能重复:
示例2、确定主键,学生编号,教师编号,出现冗余
出现的问题:
①虽然确定了主键,但是此表会出现大量的冗余,主要涉及到的冗余字段有“学生姓名”和“教师姓名”
②出现冗余的原因是:学生姓名部分依赖了主键的一个字段”学生编号“,而没有依赖“教师编号”,教师姓名部分依赖了主键的一个字段“教师编号”,而没有依赖学生编号,这就是第二范式的部分依赖
改进版:学生和老师之间是多对多,所以需要一个中间表来建立这种联系
辅助表:(教师和学生的关系表)
这是典型的多对多设计
3、第三范式
建立在第二范式的基础上,要求非主键字段不能传递依赖于主键字段。
实例:
分析:
①从表中看班级名称存在冗余,班级名称没有直接依赖于主键
②班级名称字段依赖于班级编号,班级编号依赖于学生编号,那么这就是传递依赖
改进版:
①把冗余的字段拿出来建立表
②学生信息表中,班级编号设置为外键
学生信息表:
班级信息表:
典型的一对多