zoukankan      html  css  js  c++  java
  • 数据库三大范式

    原文:http://www.cnblogs.com/linjiqin/archive/2012/04/01/2428695.html

    为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。

     

    ◆ 第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。 
    考虑这样一个表:【联系人】(姓名,性别,电话) 
    如果在实际场景中,一个联系人有家庭电话和公司电话,那么这种表结构设计就没有达到 1NF。要符合 1NF 我们只需把列(电话)拆分,即:【联系人】(姓名,性别,家庭电话,公司电话)。1NF 很好辨别,但是 2NF 和 3NF 就容易搞混淆。 

     

     

    ◆ 第二范式(2NF):首先是 1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。

    一个表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中;

    不符合第二范式的例子: 

    表:学号, 姓名, 年龄, 课程名称, 成绩, 学分; 

    这个表明显说明了两个事务:学生信息, 课程信息; 

    存在问题: 

    数据冗余,每条记录都含有相同信息; 
    删除异常:删除所有学生成绩,就把课程信息全删除了; 
    插入异常:学生未选课,无法记录进数据库; 
    更新异常:调整课程学分,所有行都调整。 

     

     

    3.第三范式(确保每列都和主键列直接相关,而不是间接相关) (也就是说不能有传到性)

    第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。

    比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(比如姓名、所属公司等)的字段

     

     

    ◆ 第三范式(3NF):首先是 2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。 
    考虑一个订单表【Order】(OrderID,OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity)主键是(OrderID)。 
    其中 OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity 等非主键列都完全依赖于主键(OrderID),所以符合 2NF。不过问题是 CustomerName,CustomerAddr,CustomerCity 直接依赖的是 CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3NF。

     

     

     

     

     

     

     

    在实际开发中最为常见的设计范式有三个:

    1.第一范式(确保每列保持原子性)

    第一范式是最基本的范式。如果数据库表中的所有字段值都是不可分解的原子值,就说明该数据库表满足了第一范式。

    第一范式的合理遵循需要根据系统的实际需求来定。比如某些数据库系统中需要用到“地址”这个属性,本来直接将“地址”属性设计成一个数据库表的字段就行。但是如果系统经常会访问“地址”属性中的“城市”部分,那么就非要将“地址”这个属性重新拆分为省份、城市、详细地址等多个部分进行存储,这样在对地址中某一部分操作的时候将非常方便。这样设计才算满足了数据库的第一范式,如下表所示。

    上表所示的用户信息遵循了第一范式的要求,这样在对用户使用城市进行分类的时候就非常方便,也提高了数据库的性能。

     

    上面这张表设计有问题:

    人物的居住地址是有多个的,应该属于一对多的关系,(参考:淘宝收货地址的管理)

     

                    

    2.第二范式(确保表中的每列都和主键相关)

    第二范式在第一范式的基础之上更进一层。第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,一个表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中。

    比如要设计一个订单信息表,因为订单中可能会有多种商品,所以要将订单编号和商品编号作为数据库表的联合主键,如下表所示。

     订单信息表

    这样就产生一个问题:这个表中是以订单编号和商品编号作为联合主键。这样在该表中商品名称、单位、商品价格等信息不与该表的主键相关,而仅仅是与商品编号相关。所以在这里违反了第二范式的设计原则。

    而如果把这个订单信息表进行拆分,把商品信息分离到另一个表中,把订单项目表也分离到另一个表中,就非常完美了。如下所示。

    这样设计,在很大程度上减小了数据库的冗余。如果要获取订单的商品信息,使用商品编号到商品信息表中查询即可。

     

    一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分                 

     

     

    3.第三范式(确保每列都和主键列直接相关,而不是间接相关)

    第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关。

    比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(比如姓名、所属公司等)的字段。如下面这两个表所示的设计就是一个满足第三范式的数据库表。

    这样在查询订单信息的时候,就可以使用客户编号来引用客户信息表中的记录,也不必在订单信息表中多次输入客户信息的内容,减小了数据冗余。

     

    1NF:字段不可分; 
    2NF:有主键,非主键字段依赖主键; 
    3NF:非主键字段不能相互依赖; 

    解释: 
    1NF:原子性 字段不可再分,否则就不是关系数据库; 
    2NF:唯一性 一个表只说明一个事物; 
    3NF:每列都与主键有直接关系,不存在传递依赖; 

    不符合第一范式的例子(关系数据库中create不出这样的表): 

    表:字段1, 字段2(字段2.1, 字段2.2), 字段3 ...... 

    存在的问题: 因为设计不出这样的表, 所以没有问题; 

    不符合第二范式的例子: 

    表:学号, 姓名, 年龄, 课程名称, 成绩, 学分; 

    这个表明显说明了两个事务:学生信息, 课程信息; 

    存在问题: 

    数据冗余,每条记录都含有相同信息; 
    删除异常:删除所有学生成绩,就把课程信息全删除了; 
    插入异常:学生未选课,无法记录进数据库; 
    更新异常:调整课程学分,所有行都调整。 

    修正: 

    学生:Student(学号, 姓名, 年龄); 

    课程:Course(课程名称, 学分); 

    选课关系:SelectCourse(学号, 课程名称, 成绩)。 

    满足第2范式只消除了插入异常。 


    不符合第三范式的例子: 

    学号, 姓名, 年龄, 所在学院, 学院联系电话,关键字为单一关键字"学号"; 

    存在依赖传递: (学号) → (所在学院) → (学院地点, 学院电话) 

    存在问题: 

    数据冗余:有重复值; 

    更新异常:有重复的冗余信息,修改时需要同时修改多条记录,否则会出现数据不一致的情况 

    删除异常 

    修正: 
    学生:(学号, 姓名, 年龄, 所在学院); 
    学院:(学院, 地点, 电话)。 
    作者:sunxing007

  • 相关阅读:
    topcoder srm 445 div1
    topcoder srm 440 div1
    topcoder srm 435 div1
    topcoder srm 430 div1
    topcoder srm 400 div1
    topcoder srm 380 div1
    topcoder srm 370 div1
    topcoder srm 425 div1
    WKWebView强大的新特性
    Runtime那些事
  • 原文地址:https://www.cnblogs.com/mc67/p/4990728.html
Copyright © 2011-2022 走看看