数据库复习
数据库复习
KasumiTech数据库语言(DDL、DML、DQL)
DDL (Data Definition Language) 数据定义语言
一、操作库
- 创建库 创建库(如果不存在则创建)
1
CREATE DATABASE db1;
查看所有数据库1
CREATE DATABASE IF NOT EXISTS db1;
查看某个数据库的定义信息1
SHOW DATABASES;
修改数据库字符集1
SHOW CREATE DATABASE db1;
删除数据库1
2
ALTER DATABASE db1 CHARACTER SET utf8;二、操作表1
2
DROP DATABASE db1;
创建表查看表结构1
2
3
4
5
6
7
8
9
CREATE TABLE student (
id INT,
name VARCHAR(32),
age INT,
score DOUBLE(4,1),
birthday DATE,
insert_time TIMESTAMP
);查看创建表的 SQL 语句1
DESC 表名;
修改表名1
2
SHOW CREATE TABLE 表名;添加一列1
2
ALTER TABLE 表名 RENAME TO 新的表名;删除列1
2
ALTER TABLE 表名 ADD 列名 数据类型;删除表1
2
ALTER TABLE 表名 DROP 列名;一、增加 (INSERT INTO)1
2
3
4
DROP TABLE 表名;
DROP TABLE IF EXISTS 表名;
DML (Data Manipulation Language) 数据操作语言
写全所有列名不写列名(所有列全部添加)1
2
INSERT INTO 表名 (列名1, 列名2, ..., 列名n) VALUES (值1, 值2, ..., 值n);插入部分数据1
2
INSERT INTO 表名 VALUES (值1, 值2, ..., 值n);二、删除 (DELETE)1
2
INSERT INTO 表名 (列名1, 列名2) VALUES (值1, 值2);
删除表中数据删除表中所有数据1
2
DELETE FROM 表名 WHERE 列名 = 值;高效清空表1
2
DELETE FROM 表名;
1 |
|
三、修改 (UPDATE)
不带条件的修改(会修改所有行)
1 |
|
带条件的修改
1 |
|
DQL (Data Query Language) 数据查询语言
一、基础关键字
范围查询
1 |
|
多值查询
1 |
|
非空值查询
1 |
|
模糊查询
1 |
|
二、排序查询 (ORDER BY)
1 | SELECT * FROM person ORDER BY math DESC; |
三、聚合函数
1 | SELECT COUNT(id), MAX(score), MIN(score), SUM(score), AVG(score) FROM student; |
四、分组查询 (GROUP BY)
示例
1 |
|
五、分页查询
1 |
|
六、内连接查询
隐式内连接
1 |
|
显式内连接
1 |
|
七、外连接查询
左外连接
1 |
|
右外连接
1 |
|
八、子查询
单行单列
1 | SELECT * FROM emp WHERE salary = (SELECT MAX(salary) FROM emp); |
多行单列
1 | SELECT * FROM emp WHERE dept_id IN (SELECT id FROM dept WHERE name IN ('财务部', '市场部')); |
多行多列
1 | SELECT * |
- 子查询的结果是单行单列的
子查询可以作为条件,使用运算符去判断。
运算符:>
>=
<
<=
=
1 | -- 查询员工工资小于平均工资的人 |
Chapter 1:绪论
1.1 数据库的四个基本概念:
数据(data):符号记录,数据的含义称为语义;
数据库(DataBase,DB):长期存储在计算机内、有组织的可共享的大量数据的集合;
数据库管理系统(DataBase management System,DBMS):位于用户和OS之间的一个基础软件;
包括几个功能:数据库定义语言DDL,数据库操纵语言DML,数据库的建立和维护等等。
数据库系统(DataBase System,DBS):由DB、DBMS、应用程序和数据库管理员DBA组成的系统。
1.2 数据库管理的三个阶段:
人工管理阶段:没有OS,数据不保存,不共享,没有独立性,冗余度大;
文件系统阶段:有文件系统,数据保存,不共享,独立性差,冗余度大;
数据库系统阶段:数据结构化,共享性高,冗余度小,具有高度的物理独立性和一定的逻辑独立性。
1.3 数据模型:
包括两类,概念(信息)模型以及逻辑模型、物理模型。
概念模型:将现实世界的数据抽象建模。
实体(客观存在的东西),属性,码(唯一标识实体的属性集),实体型,实体集。
实体间的联系:一对一,一对多,多对多。
常用E-R模型。
逻辑模型:包括层次模型(树)、网状模型(图)、关系模型(表),面向对象模型等。
物理模型:数据的存储方式,存取方法。
1.4 数据库系统的三级模式结构
三级模式结构:外模式、模式和内模式。
模式:也称逻辑模式,所有用户的公共逻辑视图。一个数据库只有一个模式。
外模式:也称用户模式,是数据库用户的数据视图,与某一应用有关。每个用户只能访问相应外模式的数据。
内模式:也称存储模式,一个数据库只有一个内模式。是数据物理结构和存储方式的描述。
1.5 数据库的二级映像与数据独立性
外模式/模式映像:一个模式可以有多个外模式,对于每个外模式有一个外模式/模式映像,
数据的逻辑独立性:当模式改变时,只需要改变外模式/模式映像,可以使外模式保持不变。
应用程序是根据外模式编写的,所以应用程序不变,保证了数据和程序的逻辑独立性。
模式/内模式映像:模式/内模式映像是唯一的。
数据的物理独立性:当存储结构改变时,只需要改变模式/内模式映像,可以使模式保持不变。
所以应用程序不变,保证了数据和程序的物理独立性。
Chapter 2:关系数据库
2.1 关系的相关概念
关系就是一张二维表。
域(domin):属性的取值范围。域的不同取值个数称为基数。
笛卡尔积:几组域相乘,得到的每条记录叫做一个元组,每个元组由分量组成。
笛卡尔积的基数是各个域的基数相乘的结果。
关系是笛卡尔积的子集。
关系的目或度:n个域做笛卡尔积,目就为n。单元关系,n = 1。
候选码:候选码的值能唯一标识一个元组,它的子集不能。
主码:候选码中的一个。
主属性:候选码中的属性。非主属性:相反。
2.2 关系的完整性
实体完整性:主属性不能取空值;
参照完整性:若属性(组)F是关系R的外码,它与关系S的主码K相对应,则对于R中每个元组在F上的值:或者取空值,或者等于S中某个元组的主码值;
用户定义完整性:具体情况具体分析,比如用户姓名必须唯一,用户年龄必须大于0等等。
2.3 关系代数
传统的集合运算:二目运算,包括交、并、差和笛卡尔积。
对于并、差和交运算,两个运算的关系必须有相同的目,且相应属性取自同一个域。
对于笛卡尔积,两个n目和m目的关系运算后得到(n+m)目的关系。
专门的关系运算:包括选择、投影、连接、除运算。
象集:
解释:对于 x1 在 R 中的象集 Zx1,找到 R 中所有元组中 X 属性值 x1 对应的 Z 属性的值的集合,
就是{Z1,Z2,Z3}。
选择:行操作,针对筛选条件找出符合条件的元组(行);
投影:列操作,找出对应属性的列;
连接:从两个关系的笛卡尔积中选取满足筛选条件的元组(行)。
等值连接:找到对应属性列的值相等的元组。
自然连接:一种特殊的等值连接,在等值连接的基础上删去重复列后的结果。从行和列两个角度考虑。
等值连接和自然连接的区别:
1)等值连接中不要求相等属性值的属性名相同,而自然连接要求相等属性值的属性名必须相同,即两关系只有在同名属性才能进行自然连接。
2)等值连接不将重复属性去掉,而自然连接去掉重复属性,也可以说,自然连接是去掉重复列的等值连接。
悬浮元组:自然连接时被舍弃的元组。
外连接:左、右两个关系的悬浮元组都保留的连接。
除运算:从行和列两个角度考虑。
设关系R除以关系S的结果为关系T,则T包含所有在R但不在S中的属性及其值,且T的元组与S的元组的所有组合都在R中。
Chapter 3:关系数据库标准语言SQL
3.1 数据定义
主要数据定义语句:
一个关系数据库管理系统的实例中可以建立多个数据库,一个数据库中可以建立多个模式,一个模式通常包括多个表、视图、索引等。
模式的定义与删除
定义模式实际上定义了一个命名空间。
在这个空间中可以定义该模式包含的数据库对象,例如基本表、视图、索引等。
–[] 表示可选参数,schema-name表示模式名,下文类似
– 不加模式名则默认模式名为用户名user-name
CREATE SCHEMA [schema-name] AUTHORIZATION user-name;
– 创建模式的语句可以同时在模式中创建表,视图,授权的语句
– | 表示在多个选择中任意选择其中一个
CREATE SCHEMA [schema-name] AUTHORIZATION user-name
[CREATE TABLE(…) | CREATE VIEW view-name AS …| GRANT … ON … TO …];
– CASCADE表示级联,删除模式的同时删除它下面的所有数据库对象(表,视图等)
– RESTRICT表示限制,如果该模式中已经定义了下属的数据库对象,则拒绝该DROP语句执行
– 两者必选其一!
DROP SCHEMA schema-name <CASCADE | RESTRICT>;
基本表的定义、修改与删除
基本表的定义:
1 | CREATE TABLE table-name |
– 示例:
1 | CREATE TABLE Student |
– 示例:
每一个基本表都属于一个模式,定义基本表时可以显式加上模式名,
如CREATE TABLE schema-name.table-name();
也可以在定义模式的同时定义表,前面说过;
还有一种方式,设置好所属的模式,然后隐式的定义基本表。
基本表的修改:
1 | ALTER TABLE table-name |
基本表的删除:
– CASCADE表示级联,删除表没有限制,同时删除它相关的依赖对象(视图等)
– RESTRICT表示限制,该表不能被其他表的约束所引用(如外键等),不能有视图,触发器等等
– 参数可加可不加,默认为RESTRICT
DROP TABLE table-name [CASCADE | RESTRICT];
索引的定义、修改与删除
索引的定义:
– UNIQUE表示该索引的每一个索引值只对应唯一的记录
– CLUSTER表示建立聚簇索引
– 索引可以建立在表的一列或者多列之上
– 每个列名后面可以加上可选参数次序,ASC表示升序,DESC表示降序
CREATE [UNIQUE] [CLUSTER] INDEX index-name
ON table-name(column1-name [ASC | DESC] [,column2-name, …]);
索引的修改:
– 对索引重命名
ALTER INDEX index-old_name RENAME TO index-new_name;
索引的删除:
DROP INDEX index-name;
3.2 数据查询
Bash
– DISTINCT 去掉列表达式所得结果的重复行
– ORDER BY每个列名后面可以加上可选参数次序,ASC表示升序,DESC表示降序
SELECT [ALL | DISTINCT]
FROM table-name/view-name [AS alias | alias]
[WHERE
[GROUP BY column-name [HAVING
[ORDER BY column-name [ASC | DESC]];
– 示例:
1 | SELECT Sname,Sdept,Grade |
聚集函数:
1 | COUNT(*) -- 统计元组个数 |
3.4 视图
视图是从一个或多个表中导出的虚表。数据库中只存放视图的定义,数据任存放在原来的基本表中。
建立视图:
视图可以建立在一个或多个基本表之上,也可以建立在一个或多个视图之上,或者视图和基本表之上。
行列子集视图:从单个基本表导出的,仅仅去掉某些行和列,保留主码。
– WITH CHECK OPTION表示对视图进行增删改操作时保证操作的元组满足sub select中的条件表达式
– 若省略视图的各个属性列名,则默认该视图由sub select中目标列组成
1 | CREATE VIEW view-name [(column1-name[,column2-name])] |
查询视图:和查询基本表一样。
对视图的查询,首先会检查视图是否存在。如果存在,则取出视图的定义,然后把定义中的子查询和用户的查询结合起来,转换成等价的对基本表的查询,然后执行查询。这一转换过程称为视图消解(view resolution)。
对于非行列子集视图的查询不一定能做正常的转换,如下图所示。
也可以用如下的基于派生表的查询来完成:
1 | SELECT * |
视图与派生表的区别:视图定义之后持久化保存在数据字典中,而派生表只是临时定义,类似局部变量。
更新视图:类似查询视图,对视图的更新操作也是通过视图消解转换为对基本表的更新。
更新视图的语句和更新基本表一样,如果定义视图时加上WITH CHECK OPTION可选参数,则视图消解时会自动附带定义视图时子查询中的条件表达式。
更新视图的限制:
一些视图是不可更新的,因为对这些视图的更新不能唯一地有意义地转换成对相应基本表的更新;
允许对行列子集视图进行更新;
对其他类型视图的更新不同系统有不同限制。
视图的作用:
Chapter 4:数据库完整性
5.1 实体完整性
实体完整性在定义基本表时用主键定义。可以定义为列级或表级约束条件。
每当用户对基本表插入记录或对主键列进行更新操作时,将检查主键值是否唯一,主键各属性是否为空。
5.2 参照完整性
参照完整性在定义基本表时用外键定义。
对被参照表和参照表进行增删改时有可能破坏参照完整性。
当发生不一致时,有三种处理策略:
拒绝(NO ACTION)执行
级联(CASCADE)操作
设置为空值(NULL)
5.3 用户定义完整性
用户定义完整性在定义基本表时定义属性上的约束条件。
主要包括:
列值非空(NOT NULL)
列值唯一(UNIQUE)
检查列值是否满足 CHECK 条件表达式
– 示例:
1 |
|
5.4 完整性约束命名子句
– constraint condition 包括NOT NULL,UNIQUE,PRIMARY KEY,FOREIGN KEY,CHECK 短语等
CONSTRAINT constraint-name
– 示例:
1 | CREATE TABLE Student |
Chapter 5:关系数据理论
6.1 问题提出
关系模式存在的问题:
数据冗余:不能避免,只能降低
更新异常:可以避免
插入异常:可以避免
删除异常:可以避免
一个好的关系模式应当不会发生以上三种异常,数据冗余尽可能低。
6.2 规范化
函数依赖:
函数依赖重点在于函数,稍微学过数学的人都知道函数的定义,定义域中两个相同的值不可能映射到不同的值域中的值,否则就不叫函数依赖。
码:
若一个或一组属性K完全函数确定关系R的全体属性U,则称为R的候选码。
若关系R的全体属性U部分函数依赖于K,则K称为超码。
候选码多于一个时,选择其中一个作为关系R的主码。
包含在任意一个候选码中的属性称为主属性。非主属性相反。
6.3 范式
关系数据库中的关系要满足一定的要求,满足不同程度要求的为不同范式。
范式由低级到高级:1NF –> 2NF –> 3NF –> BCNF –> 4NF –> 5NF,
要求越来越高,高级范式一定满足低级范式的要求。
一个低一级的范式可以通过模式分解转换为若干个高一级范式的关系模式的集合,这个过程称为规范化。
对于一个关系R,也并非范式越高越好。
第一范式(1NF):每一个分量必须是不可分的数据项;
第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库。
第二范式(2NF):若关系R满足1NF,且每一个非主属性完全函数依赖于任何一个候选码,则R满足2NF;
第三范式(3NF):若关系R中每一个非主属性既不传递依赖于码,也不部分依赖于码,则R满足3NF;
BC范式(BCNF):若关系R中每一个决定因素都包含码,则R满足BCNF。
BCNF消除了主属性对码的部分和传递函数依赖。