第一范式(1NF)设置了一个有组织的数据库非常基本的规则:
-
定义所需要的数据项,因为它们成为在表中的列。放在一个表中的相关的数据项。
-
确保有数据没有重复的组。
-
确保有一个主键。 PRIMARY KEY (ID)
1NF的第一条规则:
必须定义的数据项。这要求我们数据要被存储,组织数据到列,限定数据的每一列包含什么类型,最后把相关列到自己的表中。
例如,把所有涉及会议地点列到地点表,那些有关会员在会员明细表,等等。
1NF的第二条规则:
下一步骤是确保有数据的无重复组。考虑到我们有如下表:
CREATE TABLE CUSTOMERS(
ID INT NOT NULL,
NAME VARCHAR (20) NOT NULL,
AGE INT NOT NULL,
ADDRESS CHAR (25),
ORDERS VARCHAR(155)
);
因此,如果我们填充这个表一个客户有多个订单,那么数据如下:
ID | NAME | AGE | ADDRESS | ORDERS |
---|---|---|---|---|
100 | Sachin | 36 | Lower West Side | Cannon XL-200 |
100 | Sachin | 36 | Lower West Side | Battery XL-200 |
100 | Sachin | 36 | Lower West Side | Tripod Large |
但按照1NF,我们需要确保数据没有重复的组。因此,让我们分解上面的表格分为两部分,并使用一个键加入行列如下:
CUSTOMERS 表:
CREATE TABLE CUSTOMERS(
ID INT NOT NULL,
NAME VARCHAR (20) NOT NULL,
AGE INT NOT NULL,
ADDRESS CHAR (25),
PRIMARY KEY (ID)
);
此表将有以下记录:
ID | NAME | AGE | ADDRESS |
---|---|---|---|
100 | Sachin | 36 | Lower West Side |
ORDERS 表 :
CREATE TABLE ORDERS(
ID INT NOT NULL,
CUSTOMER_ID INT NOT NULL,
ORDERS VARCHAR(155),
PRIMARY KEY (ID)
);
此表将具有以下记录:
ID | CUSTOMER_ID | ORDERS |
---|---|---|
10 | 100 | Cannon XL-200 |
11 | 100 | Battery XL-200 |
12 | 100 | Tripod Large |
1NF的第三个规则:
第一范式的最终规则,创建一个主键,我们已经在每个表中创建主键了。
第二范式指出,它应满足所有1NF的规则,必须有任意列不依赖主键关系:
考虑客户订单的关系,你想存储客户ID,客户名称,订单ID和订单的细节,以及购买日期:
CREATE TABLE CUSTOMERS(
CUST_ID INT NOT NULL,
CUST_NAME VARCHAR (20) NOT NULL,
ORDER_ID INT NOT NULL,
ORDER_DETAIL VARCHAR (20) NOT NULL,
SALE_DATE DATETIME,
PRIMARY KEY (CUST_ID, ORDER_ID)
);
此表是第一范式,因为它遵循了第一范式的所有规则。在该表中,主键由CUST_ID和ORDERID组成。 它们是唯一的,假设同一客户将很难订购同样的东西。
然而,该表不是在第二范式,因为有主键和列的部分相关性。CUST_NAME依赖于CUST_ID,并有一个客户的名字和他所购买之间没有真正的联系。订单细节和购买日期也取决于ORDERID,但他们不依赖于CUST_ID,因为有一个CUST_ID和订单的详细信息或SALE_DATE之间没有联系。
为了使这个表符合第二范式,需要的列分在三个表。
首先,创建一个表来存储客户的详细信息如下:
CREATE TABLE CUSTOMERS(
CUST_ID INT NOT NULL,
CUST_NAME VARCHAR (20) NOT NULL,
PRIMARY KEY (CUST_ID)
);
接下来,创建一个表来存储每个订单的详细信息:
CREATE TABLE ORDERS(
ORDER_ID INT NOT NULL,
ORDER_DETAIL VARCHAR (20) NOT NULL,
PRIMARY KEY (ORDER_ID)
);
最后,创建第三个表存储只是CUST_ID和ORDER_ID让所有的客户订单可以跟踪:
CREATE TABLE CUSTMERORDERS(
CUST_ID INT NOT NULL,
ORDER_ID INT NOT NULL,
SALE_DATE DATETIME,
PRIMARY KEY (CUST_ID, ORDER_ID)
);
表满足以下条件时就是第三范式:
-
满足第二范式
-
所有非主字段都是依赖于主键
非主字段的依赖是数据,例如,在下面的表中,街道名称,城市,国家是可绑定到邮政编码的。
CREATE TABLE CUSTOMERS(
CUST_ID INT NOT NULL,
CUST_NAME VARCHAR (20) NOT NULL,
DOB DATE,
STREET VARCHAR(200),
CITY VARCHAR(100),
STATE VARCHAR(100),
ZIP VARCHAR(12),
EMAIL_ID VARCHAR(256),
PRIMARY KEY (CUST_ID)
);
邮政编码和地址之间的依赖关系称为传递依赖。为了符合第三范式,所有你需要做的是移动的街道,城市和国家领域纳入自己表中,您可以调用邮编表:
CREATE TABLE ADDRESS(
ZIP VARCHAR(12),
STREET VARCHAR(200),
CITY VARCHAR(100),
STATE VARCHAR(100),
PRIMARY KEY (ZIP)
);
接下来,改变CUSTOMERS表如下:
CREATE TABLE CUSTOMERS(
CUST_ID INT NOT NULL,
CUST_NAME VARCHAR (20) NOT NULL,
DOB DATE,
ZIP VARCHAR(12),
EMAIL_ID VARCHAR(256),
PRIMARY KEY (CUST_ID)
);
去掉传递依赖的优势主要有二点。首先,数据的重复的量减少,因此,数据库变得更小。
第二个优点是数据的完整性。当重复数据的变化,还有只更新一些数据,尤其是如果它摊开在多个数据库中不同的地方的一大隐患。例如,如果地址和邮政编码数据存储在三个或四个不同的表,然后在邮政编码的任何变化都需要波及到那些三个或四个表中的每一个记录。