数据库的三大范式...

规范数据库设计

前言

这一节学习的是,规范数据库设计,重点是数据库设计的三大范式。为了更好的了解,举了一些例子。

1、为什么需要设计

当数据库比较复杂的时,我们就需要设计了

糟糕的数据库设计:

  • 数据太大,浪费空间
  • 数据库插入、删除很麻烦,容易造成异常
  • 程序的性能差

良好的数据库设计:

  • 节约内存空间
  • 保障数据库的完整性
  • 方便我们开发系统

软件开发中,关于数据库的设计

  1. 分析需求:分析业务和需要处理的数据库需求
  2. 概要设计:设计关系图 E-R图

设计数据库的步骤:(个人博客为例)

  1. 收集信息,分析需求

    • 用户表(用户登录注销、用户的个人信息,写博客,创建分类)
    • 分类表(文章分类,谁创建的)
    • 文章表(文章的信息)
    • 友情链接表(友情链接的信息)
    • 自定义表(系统信息,某个关键的字,或者一些主字段) 在这里插入图片描述
  2. 标识实体(把需求落地到每个字段) 在这里插入图片描述

  3. 标识实体之间的关系

    • 写博客 user --> blog
    • 创建分类 user --> category
    • 关注 user --> user
    • 友链 links
    • 评论 user --> user -->blog

2、三大范式

为什么需要数据规范化?

  • 信息重复
  • 更新异常
  • 插入异常
    • 无法正常显示信息
  • 删除异常
    • 丢失有效信息

三大范式

参考博客:关系型数据库设计:三大范式的通俗理解

第一范式(1NF)

要求数据库的每一列都是不可分割的原子数据项

img

img

将 家庭信息 拆为 家庭人口和户籍 学校信息 拆为 学历和所在年级

第二范式(2NF)

在第一范式的基础上,每张表只描述一件事情

img

在上图所示的情况中,同一个订单中可能包含不同的产品,因此主键必须是“订单号”和“产品号”联合组成,

但可以发现,产品数量、产品折扣、产品价格与“订单号”和“产品号”都相关,但是订单金额和订单时间仅与“订单号”相关,与“产品号”无关,

这样就不满足第二范式的要求,调整如下,需分成两个表:

img

第三范式(3NF)

在第二范式的基础上,确保数据库表中的每一列数据都和主键直接相关,而不能间接相关

img

上表中,所有属性都完全依赖于学号,所以满足第二范式,但是“班主任性别”和“班主任年龄”直接依赖的是“班主任姓名”,

而不是主键“学号”,所以需做如下调整:

img

规范性和性能的问题(鱼和熊掌不可兼得)

关联查询的表不得超过三张表(阿里规范)

  • 考虑商业化的需求和目标(成本、用户体验)数据库的性能更加重要
  • 在规范性能的问题的时候,需要适当的考虑一下规范性
  • 故意给某些表增加一些冗余的字段(从多表查询中变为单表查询)
  • 故意增加一些计算列(从大数据量降低为小数据量的查询:索引)

后话

关于规范数据库设计的内容就这么多,如果有任何问题和错误,欢迎在评论区指出,我都会回复!