为什么需要设计数据库
结论:当数据库比较复杂时我们需要设计数据库
良好的数据库设计
- 节省数据的存储空间
- 能够保证数据的完整性
- ⽅便进⾏数据库应用系统的开发
糟糕的数据库设计:
- 数据冗余、存储空间浪费
- 内存空间浪费
- 数据更新和插⼊的异常
软件项⽬开发周期
需求分析阶段:分析客户的业务和数据处理需求
概要设计阶段:设计数据库的E-R模型图,确认需求信息的正确和完整
详细设计阶段:将E-R图转换为多张表,进⾏逻辑设计,并应用数据库设计的三⼤范式进⾏审核
代码编写阶段:选择具体数据库进⾏物理实现,并编写 代码实现前端应用
软件测试阶段:……
安装部署:……
设计数据库的步骤
收集信息:
与该系统有关⼈员进⾏交流、坐谈,充分理解数据库需要完成的任务
BBS论坛的基本功能:
用户注册和登录,后台数据库需要存放用户的注册信息和在线状态信息;
用户发贴,后台数据库需要存放贴⼦相关信息,如贴⼦内容、标题等;
论坛版块管理:后台数据库需要存放各个版块信息,如版主、版块名称、贴⼦数等;
标识对象(实体-Entity)
标识数据库要管理的关键对象或实体
实体⼀般是名词:
用户:论坛普通用户、各版块的版主
用户发的主贴
用户发的跟贴(回贴)
版块:论坛的各个版块信息
标识每个实体的属性(Attribute)
论坛用户
呢称
密码
电⼦邮件
⽣日
性别
用户的等级
备注信息
注册日期
状态
积分
主贴
发贴⼈
发贴表情
回复数量
标题
正⽂
发贴时间
点击数
状态
最后回复时间
回贴
贴⼦编号
回贴⼈
回贴表情
标题
正⽂
回贴时间
点击数
版块
版块名称
版主
本版格⾔
点击率
发贴数
标识对象之间的关系(Relationship)
跟贴和主贴有主从关系:我们需要在跟贴对象中表明它是谁的跟贴;
版块和用户有关系:从用户对象中可以根据版块对象查出对应的版主用户的情况;
主贴和版块有主从关系:需要表明发贴是属于哪个版块的;
跟贴和版块有主从关系:需要表明跟贴是属于哪个版块的;
绘制E-R图
E-R(Entity-Relationship)实体关系图
如何将E-R图转换为表
将各实体转换为对应的表,将各属性转换为各表对应的列
标识每个表的主键列,需要注意的是:没有主键的表添加ID编号列,它没有实际含义,用于做主键或外键,例如用户表中的“UID”列,版块表中添加“SID”列,发贴表和跟贴表中的“TID”列
在表之间建立主外键,体现实体之间的映射关系
数据规范化
仅有好的RDBMS并不⾜以避免数据冗余,必须在数据库的设计中创建好的表结构
Dr E.F.codd 最初定义了规范化的三个级别,范式是具有最小冗余的表结构。这些范式是:
– 第⼀范式(1st NF -First Normal Fromate)
– 第⼆范式(2nd NF-Second Normal Fromate)
– 第三范式(3rd NF- Third Normal Fromate)
第⼀范式 (1st NF)
第⼀范式的目标是确保每列的原⼦性
如果每列都是不可再分的最小数据单元(也称为最小的原⼦单元),则满⾜第⼀范式(1NF)
第⼆范式 (2nd NF)
如果⼀个关系满⾜1NF,并且除了主键以外的其他列,都依赖与该主键,则满⾜第⼆范式(2NF)
第⼆范式要求每个表只描述⼀件事情
第三范式 (3rd NF)
如果⼀个关系满⾜2NF,并且除了主键以外的其 他列都不传递依赖于主键列,则满⾜第三范式 (3NF)