《高性能Mysql》学习笔记（一）

zxdsb666. 发表于 2021-10-9 21:30

# 《高性能Mysql》学习笔记（一）

# 前言

Mysql的质量比较好的书其实并不是很多，所以可以说是看一本少一本，这本书也算是学习MYSQL必看的一本书，当然十分厚，虽然版本很老但是讲述的内容都会十分实用的，对于学习MYSQL的人可以说是一本必读的进阶好书。

最后，这篇读书笔记是整理个人以前自学的时候看书做的笔记，做的十分粗糙=-=，现在来看很多笔记记得过于基础了。另外当时很多都是截图的，很多都是图片HHHH（流量观看慎重）。

## MySQL逻辑架构图

虽然看上去比较复古，但是挺经典的。

![](https://gitee.com/lazyTimes/imageReposity/raw/master/img/20211009205005.png)

> **小贴士：**
>
> 存储引擎不会去解析sql，不同存储引擎不会相互通信，只是简单响应上层请求（**InnoDB引擎除外，会解析外键定义，因为mysql服务器本身没有实现该功能**）

## 连接管理和安全性

每一个连接都是一个单独线程，服务器会对连接**缓存**而不是创建或者销毁线程

## 优化与执行

执行流程：

1. 解析查询
2. 创建数据结构（解析树），优化（重写查询，读表顺序优化，选择索引等）
3. 尝试查询缓存（SELECT）
4. 返回结果

## 并发控制

目的：内部拥有锁机制防止数据破坏

### 共享锁和排他锁（读锁和写锁）

+ 读锁是共享的，相互不阻塞
+ 写锁是排他的，一个写锁会阻止其他读锁和写锁

### 锁粒度

提高共享资源并发性就是让锁更有选择性，让锁只监控部分数据

记住：**任何时候，给定资源下，锁定数据量越少，并发程度越高，只要相互不发生冲突即可**

mysql提供多个存储引擎支持丰富的锁策略

## 表锁 (table lock)

表锁是msyql中最基本的锁策略，开销最小的策略，这种方式类似邮箱的加锁机制：会锁定整张表，用户访问时候，对表进行写操作，需要优先获得写锁，会阻塞其他用户读写操作，**只有没有写锁时候，其他用户才能获得读锁**，读锁之间是不相互阻塞的，特定场景表锁可以有良好性能。

注意事项：

1. **写锁**比**读锁**有**更高的优先级**，写锁有可能会插入到一个读锁的前面，但是读锁不能插入到写锁队列前面
2. 服务器会为alter table 等语句默认使用表锁而不是根据引擎决定（虽然存储引擎才是真正干活的）

## 行级锁 (row lock)

该锁可以**最大程度支持**并发处理（与此同时带来巨大锁开销），**InnoDB**和**XtraDB**，实现了行级锁，行级锁只在存储层也就是存储引擎实现，而mysql服务层没有实现

# 事务

## 事务的ACID

+ **A（atomicity）原子性**
+ 一个事务是一个不可分割的单位，事务中的所有操作，要么全完成，要么全不完成，任何一个操作的失败，都会回滚到事务执行之前的状态。
+ **C （consistency）一致性**
+ 事务结束后，系统状态是一致的。即，在并发操作时，系统的状态也要和串行执行事务时一样。
+ **I（isolation）隔离性**
+ 并发执行的事务之间，无法看到彼此的系统状态。
+ **D （durability）持续性**
+ 在事务完成后，事务对数据库的操作会被持久保存在数据库中，不会被回滚。

事务使用与否根据实际业务情况而定（甚至可以不使用事务，而是使用sql 进行一定的安全措施），如何选择合适的 mysql 引擎来解决问题可能事务本身更加重要。

## 隔离级别

![](https://gitee.com/lazyTimes/imageReposity/raw/master/img/20211009075833.png)

## 死锁

如果多个线程同时更改同一行数据，你们两个线程互相等待对面的锁，造成死锁

### 解决方法：

1. 例如：InnoDB 检测死循环依赖，并且立即返回一个错误（死锁会造成慢查询）。
2. 查询时间达到锁等待超时设定时间之后放弃锁请求。
3. InnoDB目前（5.1）处理方法：**将持有最少行级排他锁的事务进行回滚**。
4. 大多数时候因为数据冲突，有时候确实是因为存储引擎方式引起的！！！

> 只有部分或者完全回滚一个事务才能打破死锁，事务性系统无法避免。**大多数时候只需要重新执行死锁事务即可**
>

## 事务日志

事务日志采用追加方式，因此I/O的消耗比较小，内存修改数据后台慢慢刷会磁盘，目前大多数存储引擎都是这样实现被称为：**预写式日志**

# mysql中的事务

+ innoDB
+ NDB cluster

## 自动提交

默认情况下我们所写的SQL默认都是自动提交的，也就是说在执行的时候MYSQL都会给我们自定加上一条，COMMIT语句，也就是自动提交事务，我们可以使用`SHOW VARIABLES LIKE 'AUTOCOMMIT'`语句查看是否开启自动提交。

![](https://gitee.com/lazyTimes/imageReposity/raw/master/img/20211009075909.png)

切记：查找对应版本会产生 **AUTO_COMMIT** 所有语句

## 设置隔离级别

命令如下：

`> SET SESSION TRASACTION ISOLATTION LEVEL READ COMMITTED`

mysql 可以识别 4 个 ansi 隔离级别，innodb 引擎也支持

## 混合使用存储引擎

mysql 服务层不管理事务，事务下层存储引擎实现，同一个事务使用多种存储引擎不可靠

**mysql 对非事务型表不会有提示！！！！**

**mysql 对非事务型表不会有提示！！！！**

**mysql 对非事务型表不会有提示！！！！**

## 隐藏和显式锁定

记住下面的两条特点：

+ INNODB 使用两阶段锁定协议，锁只有在执行提交或者回滚才会释放

+ INNODB 会根据隔离级别自动加锁

innodb支持显示的加锁如下：

1. `SELECT ... FROM IN SHARE MODE`

2. `SELECT ... FOR UPDATE`

> 注意：这不是sql规范，而是MYSQL自己增加的语法支持

mysql 中的**lock 和 unlock tables 语句和存储引擎无关**，而是在**服务层**实现，**不能用来替代事务性存储引擎**，有其他用途

> 建议：除了事务中禁用autocommit ，可以使用lock tables 之外，其他任何时候不要显式执行 lock tables，不管是什么存储引擎

# 多版本并发控制（mvcc）

mvcc实现：保存数据在某个时间点的快照实现，记住：根据事务开始时间不同，每个事务对同一张表，同一时刻看到的数据可能是不一样的，这里可以引申：**悲观锁**和**乐观锁**

## innodb 的 mvvc

实现原理：通过在每行记录后面保存两个隐藏的列实现

+ 一个列保存行创建时间
+ 另一个保存过期时间（删除时间）

事务开始时候系统版本号（每个新事务都会递增版本号）作为事务版本号，和查询到记录的版本号比较

REPEATABLE READ 隔离级别操作

![](https://gitee.com/lazyTimes/imageReposity/raw/master/img/20211009080521.png)

MVCC 只在 **REPEATABLE READ** 和 **READ COMMITTED**两个隔离级别工作。

# mysql 存储引擎

+ 建表时候，会在`mytable.frm `中定义表定义。

+ 表的定义是在**服务层**。
+ 不同系统存储形式不一样（数据和索引）。

使用`show table status`命令显示表的相关信息，例如 `show table status like 'user' \G`，mysql5.1中的`innodb plugin `支持一些新特性（BLOB存储方式使用），mysql5.1一定要使用 innodb plugin ，比旧innodb要好得多

> mysql 5.5 之后 innodb plugin 才替换掉旧的 Innodb

## Innodb 概览

### **mysql4.1** 之后新特性

+ innodb 可以将每个表的数据和索引放在单独文件当中
+ innodb 可以将裸设备作为存储介质

### Innodb 特点

+ 使用mvcc 支持高并发
+ 实现了四个标准隔离级别（默认级别为 **REPEATABLE READ**(可重复读)）。
+ 使用间隙锁(next-key locking) 策略防止幻读的出现。
+ 间隙锁不仅锁定查询行，还对索引进行锁定。
+ INNODB 基于 **聚簇索引** 建立。
+ 存储格式是平台独立的，意味着可以跨平台使用。
+ 内部进行优化，**可预测性预读**，可以自动在**内存**当中**创建hash索引**加速读操作**自适应哈希索引**，加速操作的加入缓冲区。
+ 阅读官方文档"InnoDB 事务模型和锁"了解更多内容。
+ innodb 通过一些机制和工具实现真正的**热备份**。

> 聚簇索引对于主键查询有非常高的性能，不过二级索引中必须包含主键列，**如果主键列很大，其他所有索引都会很大**，
>

## Myisam 存储引擎

mysql5.1 之前默认使用 MyISAM 作为存储引擎

### 特点：

+ 全文索引，压缩，空间函数
+ **不支持事务和行级锁**
+ 崩溃之后无法安全恢复

### 存储：

将表存储在两个文件当中

+ 数据文件 ( .MYD )
+ 索引文件 ( .MYI )
+ 表支持包含动态或者静态（长度固定）行，mysql根据表定义决定存储形式
+ Mysql5 当中，如果是变长行，只能处理256TB 数据
+ 修改Myisam 表指针长度，修改表 **max_rows** 和 **avg_row_length** 选项实现

### myisam特性

+ 加锁与并发：对**整张表**加锁，而不是针对行。
+ myisam 表， mysql 可以手工或者自动检查和修复操作（但是效率较低）。
+ 索引特性：即使是BLOB 和 TEXT等长字段，也可以基于500 个字符创建。
+ myisam 支持**全文索引**，基于分词创建索引。
+ 延迟更新索引键。

### myisam 压缩表

如果表中数据不再修改，可以使用myisam 压缩表，作用是减少磁盘i/o，提高查询性能。

### myisam 性能问题

最典型的性能问题是 **表锁** 的问题

# mysql 内建其他存储引擎

## Archive 引擎

1. 只支持 insert 和 sleect， mysql5.1 之前不支持索引。
2. 适合日志和数据采集类应用。
3. 支持行级锁和专用缓冲区，实现高并发插入。
4. 不是事务性引擎，只对告诉插入和压缩做了优化的简单引擎。

## Blackhole 引擎

1. 无存储，丢弃所有插入数据。但是服务器会记录blackhole 表的日志。
2. 简单的日志引擎。

## **CVS 引擎**

1. 将普通cvs 作为mysql 表处理，**不支持索引**。
2. cvs 引擎可以作为数据交换的机制（excel 表格的转换）。

## Federated 引擎

1. 访问其他mysql 服务器代理，但是默认是**禁用**的。

## **Memory引擎**

1. 可以快速访问数据使用 Memory表。
2. 所有数据都是在内存当中。
3. 每行长度固定。
4. 并发性能较低。
5. 作用：
1. 查找或者映射表。
2. 缓存周期性聚合数据。
3. 保存数据产生的中间数据。
6. 如果mysql 查询使用临时表保存结果，你们内部使用就是Memory 表，但是如果数据量较大，就会转为myisam 表

## Merga 引擎

1. myisam 引擎变种，多个myisam 表合并变种
2. 分区功能实现后，被放弃

3. **NDB 集群引擎**
1. 用于mysql 集群

# 第三方存储引擎

## OLTP 类引擎

1. XtraDB引擎
2. PBXT引擎
3. TokuDB 引擎

## 如何选择引擎

除非使用到了innodb 不具备的特性，并且无法替代，否则优先选择innodb

主要看待四点

1. 事务
2. 备份
3. 崩溃恢复
4. 特有特性

## 个人看法：

1. 对于极高的插入数据要求时候，可以使用myisam 或者archieve
2. 如果不知道其他引擎的特性还是建议INNODB

> 测试崩溃数据恢复问题就是模拟电源断电！！！

# 数据表引擎转换

## 1. 直接转换

`mysql> ALTER TABLE mytable ENGINE = InnoDB`

这种方式性能很低，而且会加锁

## 2. 使用导入导出的方法

导入与导出：使用msyql 工具导出sql 语句然后手动修改引擎

## 3. 创建与查询

```mysql
mysql > create table innodb_table like myisam table;
mysql > alter table innodb_table engine = InnoDB;
mysql > insert into innodb_table select * from myisam_table
```

## 4. 数据量很大的话可以分批处理

```mysql
start transaction;
insert into innodb_table select * from myisam_table
where id between x and y;

insert into innodb_table select * from myisam_table
where id between x and y;

insert into innodb_table select * from myisam_table
where id between x and y;

.......

commit
```

# 总结

第一篇读书笔记主要介绍了和MYSQL的存储引擎的重点内容，以及简单介绍MYSQL 的事务相关内容，在前言也说过，内容比较基础并且由于以前偷懒很多都是截图书上的内容=-=。

沂源扛把子 发表于 2021-10-10 09:52

好...............

lcg2014 发表于 2021-10-10 10:45

mysql，开源数据库主流，值得学习

ydss 发表于 2021-10-11 07:52

这个非常好，感谢lz分享，先学一下第一部

凤舞九天lo 发表于 2021-10-11 11:26

什么大数据啊，今天才刷到帖说面试擅长mysql，没看高性能的mysql；

Sly1123 发表于 2021-10-11 13:24

mark一下，后面详细学习下

MOEYU_VANILLA 发表于 2021-10-11 22:30

感谢分享

页: [1]

吾爱破解 - 52pojie.cn's Archiver

《高性能Mysql》学习笔记（一）