简述三范式是什么，举些例子？

八股文_数据仓库 0 25

三范式是关系数据库设计中的一种规范化理论，用来确保数据表在结构上尽量避免冗余，并保证数据的一致性。它包含了三个主要的范式：第一范式（1NF）、第二范式（2NF）和第三范式（3NF）。

第一范式（1NF）：要求每个字段的值都是原子的，也就是说，字段不能包含重复的、组合的数据。例如，不能在一个字段里存储多个值。
第二范式（2NF）：在满足1NF的基础上，要求每个非主属性完全依赖于主键，而不是部分依赖。也就是说，不能有部分依赖关系。如果一个表有复合主键，非主键字段必须依赖于整个复合主键，而不是主键的一部分。
第三范式（3NF）：在满足2NF的基础上，要求非主键字段之间没有传递依赖关系。也就是说，非主键字段不能依赖于其他非主键字段。

第一范式要求每个字段的数据都必须是不可分割的单一值，避免使用重复组或数组。例如：

不满足1NF：

学生ID	姓名	课程
1	张三	数学, 英语, 物理
2	李四	化学, 生物

在这个表中，”课程”字段包含了多个课程值，这违反了第一范式。我们需要将这些数据拆分开来：

满足1NF：

第二范式要求在满足1NF的基础上，所有非主键属性必须完全依赖于主键。这解决了部分依赖的问题。如果表有复合主键，非主键属性不能只依赖于主键的一部分。

不满足2NF：

在这个表中，”学生姓名”字段依赖于”学生ID”字段，而不是复合主键（学生ID+课程ID）。这违反了第二范式。我们可以将学生信息和课程信息分成两个表来解决这一问题：

满足2NF：

学生表：

学生ID	学生姓名
1	张三
2	李四

课程表：

第三范式要求在满足2NF的基础上，非主键字段之间不能有传递依赖。例如，如果A字段决定了B字段，B字段又决定了C字段，那么C字段就依赖于A字段，但这是一种传递依赖，不符合3NF。

不满足3NF：

学生ID	学生姓名	学生城市	城市邮政编码
1	张三	北京	100000
2	李四	上海	200000

在这个表中，”城市邮政编码”依赖于”学生城市”，而”学生城市”又依赖于”学生ID”。这形成了传递依赖，因此不符合第三范式。我们可以将城市信息拆分到另一个表中：

满足3NF：

学生表：

学生ID	学生姓名	学生城市
1	张三	北京
2	李四	上海

城市表：

城市	城市邮政编码
北京	100000
上海	200000

通过这样的设计，避免了不必要的冗余，提高了数据的规范性。

三范式是确保数据库结构规范化的理论基础，通过消除冗余、避免数据依赖问题，能够提升数据库的一致性和可维护性。在实际应用中，我们通常会在设计数据库时尽量达到第三范式，但有时为了性能或复杂查询的需要，可能会适当进行一些范式的放宽。