You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

260 lines
13 KiB
Markdown

2 years ago
# 38 | 都说InnoDB好那还要不要使用Memory引擎
我在上一篇文章末尾留给你的问题是两个group by 语句都用了order by null为什么使用内存临时表得到的语句结果里0这个值在最后一行而使用磁盘临时表得到的结果里0这个值在第一行
今天我们就来看看,出现这个问题的原因吧。
# 内存表的数据组织结构
为了便于分析我来把这个问题简化一下假设有以下的两张表t1 和 t2其中表t1使用Memory 引擎, 表t2使用InnoDB引擎。
```
create table t1(id int primary key, c int) engine=Memory;
create table t2(id int primary key, c int) engine=innodb;
insert into t1 values(1,1),(2,2),(3,3),(4,4),(5,5),(6,6),(7,7),(8,8),(9,9),(0,0);
insert into t2 values(1,1),(2,2),(3,3),(4,4),(5,5),(6,6),(7,7),(8,8),(9,9),(0,0);
```
然后我分别执行select \* from t1和select \* from t2。
![](https://static001.geekbang.org/resource/image/3f/e6/3fb1100b6e3390357d4efff0ba4765e6.png?wh=599*330)
图1 两个查询结果-0的位置
可以看到内存表t1的返回结果里面0在最后一行而InnoDB表t2的返回结果里0在第一行。
出现这个区别的原因,要从这两个引擎的主键索引的组织方式说起。
表t2用的是InnoDB引擎它的主键索引id的组织方式你已经很熟悉了InnoDB表的数据就放在主键索引树上主键索引是B+树。所以表t2的数据组织方式如下图所示
![](https://static001.geekbang.org/resource/image/4e/8d/4e29e4f9db55ace6ab09161c68ad8c8d.jpg?wh=1142*880)
图2 表t2的数据组织
主键索引上的值是有序存储的。在执行select \*的时候就会按照叶子节点从左到右扫描所以得到的结果里0就出现在第一行。
与InnoDB引擎不同Memory引擎的数据和索引是分开的。我们来看一下表t1中的数据内容。
![](https://static001.geekbang.org/resource/image/dd/84/dde03e92074cecba4154d30cd16a9684.jpg?wh=1142*880)
图3 表t1 的数据组织
可以看到内存表的数据部分以数组的方式单独存放而主键id索引里存的是每个数据的位置。主键id是hash索引可以看到索引上的key并不是有序的。
在内存表t1中当我执行select \*的时候走的是全表扫描也就是顺序扫描这个数组。因此0就是最后一个被读到并放入结果集的数据。
可见InnoDB和Memory引擎的数据组织方式是不同的
* InnoDB引擎把数据放在主键索引上其他索引上保存的是主键id。这种方式我们称之为**索引组织表**Index Organizied Table
* 而Memory引擎采用的是把数据单独存放索引上保存数据位置的数据组织形式我们称之为**堆组织表**Heap Organizied Table
从中我们可以看出,这两个引擎的一些典型不同:
1. InnoDB表的数据总是有序存放的而内存表的数据就是按照写入顺序存放的
2. 当数据文件有空洞的时候InnoDB表在插入新数据的时候为了保证数据有序性只能在固定的位置写入新值而内存表找到空位就可以插入新值
3. 数据位置发生变化的时候InnoDB表只需要修改主键索引而内存表需要修改所有索引
4. InnoDB表用主键索引查询时需要走一次索引查找用普通索引查询的时候需要走两次索引查找。而内存表没有这个区别所有索引的“地位”都是相同的。
5. InnoDB支持变长数据类型不同记录的长度可能不同内存表不支持Blob 和 Text字段并且即使定义了varchar(N)实际也当作char(N),也就是固定长度字符串来存储,因此内存表的每行数据长度相同。
由于内存表的这些特性每个数据行被删除以后空出的这个位置都可以被接下来要插入的数据复用。比如如果要在表t1中执行
```
delete from t1 where id=5;
insert into t1 values(10,10);
select * from t1;
```
就会看到返回结果里id=10这一行出现在id=4之后也就是原来id=5这行数据的位置。
需要指出的是表t1的这个主键索引是哈希索引因此如果执行范围查询比如
```
select * from t1 where id<5;
```
是用不上主键索引的,需要走全表扫描。你可以借此再回顾下[第4篇文章](https://time.geekbang.org/column/article/69236)的内容。那如果要让内存表支持范围扫描,应该怎么办呢
# hash索引和B-Tree索引
实际上内存表也是支持B-Tree索引的。在id列上创建一个B-Tree索引SQL语句可以这么写
```
alter table t1 add index a_btree_index using btree (id);
```
这时表t1的数据组织形式就变成了这样
![](https://static001.geekbang.org/resource/image/17/e3/1788deca56cb83c114d8353c92e3bde3.jpg?wh=1142*880)
图4 表t1的数据组织--增加B-Tree索引
新增的这个B-Tree索引你看着就眼熟了这跟InnoDB的b+树索引组织形式类似。
作为对比,你可以看一下这下面这两个语句的输出:
![](https://static001.geekbang.org/resource/image/a8/8a/a85808fcccab24911d257d720550328a.png?wh=641*540)
图5 使用B-Tree和hash索引查询返回结果对比
可以看到执行select \* from t1 where id<5的时候,优化器会选择B-Tree索引,所以返回结果是04 使用force index强行使用主键id这个索引,id=0这一行就在结果集的最末尾了。
其实一般在我们的印象中内存表的优势是速度快其中的一个原因就是Memory引擎支持hash索引。当然更重要的原因是内存表的所有数据都保存在内存而内存的读写速度总是比磁盘快。
但是,接下来我要跟你说明,为什么我不建议你在生产环境上使用内存表。这里的原因主要包括两个方面:
1. 锁粒度问题;
2. 数据持久化问题。
# 内存表的锁
我们先来说说内存表的锁粒度问题。
内存表不支持行锁,只支持表锁。因此,一张表只要有更新,就会堵住其他所有在这个表上的读写操作。
需要注意的是这里的表锁跟之前我们介绍过的MDL锁不同但都是表级的锁。接下来我通过下面这个场景跟你模拟一下内存表的表级锁。
![](https://static001.geekbang.org/resource/image/f2/29/f216e2d707559ed2ca98fbe21e509f29.png?wh=933*221)
图6 内存表的表锁--复现步骤
在这个执行序列里session A的update语句要执行50秒在这个语句执行期间session B的查询会进入锁等待状态。session C的show processlist 结果输出如下:
![](https://static001.geekbang.org/resource/image/14/16/14d88076dad6db573f0b66f2c17df916.png?wh=1273*172)
图7 内存表的表锁--结果
跟行锁比起来,表锁对并发访问的支持不够好。所以,内存表的锁粒度问题,决定了它在处理并发事务的时候,性能也不会太好。
# 数据持久性问题
接下来,我们再看看数据持久性的问题。
数据放在内存中,是内存表的优势,但也是一个劣势。因为,数据库重启的时候,所有的内存表都会被清空。
你可能会说如果数据库异常重启内存表被清空也就清空了不会有什么问题啊。但是在高可用架构下内存表的这个特点简直可以当做bug来看待了。为什么这么说呢
**我们先看看M-S架构下使用内存表存在的问题。**
![](https://static001.geekbang.org/resource/image/5b/e9/5b910e4c0f1afa219aeecd1f291c95e9.jpg?wh=1142*880)
图8 M-S基本架构
我们来看一下下面这个时序:
1. 业务正常访问主库;
2. 备库硬件升级备库重启内存表t1内容被清空
3. 备库重启后客户端发送一条update语句修改表t1的数据行这时备库应用线程就会报错“找不到要更新的行”。
这样就会导致主备同步停止。当然如果这时候发生主备切换的话客户端会看到表t1的数据“丢失”了。
在图8中这种有proxy的架构里大家默认主备切换的逻辑是由数据库系统自己维护的。这样对客户端来说就是“网络断开重连之后发现内存表数据丢失了”。
你可能说这还好啊,毕竟主备发生切换,连接会断开,业务端能够感知到异常。
但是接下来内存表的这个特性就会让使用现象显得更“诡异”了。由于MySQL知道重启之后内存表的数据会丢失。所以担心主库重启之后出现主备不一致MySQL在实现上做了这样一件事儿在数据库重启之后往binlog里面写入一行DELETE FROM t1。
**如果你使用是如图9所示的双M结构的话**
![](https://static001.geekbang.org/resource/image/40/57/4089c9c1f92ce61d2ed779fd0932ba57.jpg?wh=1142*880)
图9 双M结构
在备库重启的时候备库binlog里的delete语句就会传到主库然后把主库内存表的内容删除。这样你在使用的时候就会发现主库的内存表数据突然被清空了。
基于上面的分析,你可以看到,内存表并不适合在生产环境上作为普通数据表使用。
有同学会说,但是内存表执行速度快呀。这个问题,其实你可以这么分析:
1. 如果你的表更新量大那么并发度是一个很重要的参考指标InnoDB支持行锁并发度比内存表好
2. 能放到内存表的数据量都不大。如果你考虑的是读的性能一个读QPS很高并且数据量不大的表即使是使用InnoDB数据也是都会缓存在InnoDB Buffer Pool里的。因此使用InnoDB表的读性能也不会差。
所以,**我建议你把普通内存表都用InnoDB表来代替。**但是,有一个场景却是例外的。
这个场景就是我们在第35和36篇说到的用户临时表。在数据量可控不会耗费过多内存的情况下你可以考虑使用内存表。
内存临时表刚好可以无视内存表的两个不足,主要是下面的三个原因:
1. 临时表不会被其他线程访问,没有并发性的问题;
2. 临时表重启后也是需要删除的,清空数据这个问题不存在;
3. 备库的临时表也不会影响主库的用户线程。
现在我们回过头再看一下第35篇join语句优化的例子当时我建议的是创建一个InnoDB临时表使用的语句序列是
```
create temporary table temp_t(id int primary key, a int, b int, index(b))engine=innodb;
insert into temp_t select * from t2 where b>=1 and b<=2000;
select * from t1 join temp_t on (t1.b=temp_t.b);
```
了解了内存表的特性,你就知道了, 其实这里使用内存临时表的效果更好,原因有三个:
1. 相比于InnoDB表使用内存表不需要写磁盘往表temp\_t的写数据的速度更快
2. 索引b使用hash索引查找的速度比B-Tree索引快
3. 临时表数据只有2000行占用的内存有限。
因此,你可以对[第35篇文章](https://time.geekbang.org/column/article/80147)的语句序列做一个改写将临时表temp\_t改成内存临时表并且在字段b上创建一个hash索引。
```
create temporary table temp_t(id int primary key, a int, b int, index (b))engine=memory;
insert into temp_t select * from t2 where b>=1 and b<=2000;
select * from t1 join temp_t on (t1.b=temp_t.b);
```
![](https://static001.geekbang.org/resource/image/a4/92/a468ba6d14ea225623074b6255b99f92.png?wh=2132*906)
图10 使用内存临时表的执行效果
可以看到不论是导入数据的时间还是执行join的时间使用内存临时表的速度都比使用InnoDB临时表要更快一些。
# 小结
今天这篇文章我从“要不要使用内存表”这个问题展开和你介绍了Memory引擎的几个特性。
可以看到由于重启会丢数据如果一个备库重启会导致主备同步线程停止如果主库跟这个备库是双M架构还可能导致主库的内存表数据被删掉。
因此,在生产上,我不建议你使用普通内存表。
如果你是DBA可以在建表的审核系统中增加这类规则要求业务改用InnoDB表。我们在文中也分析了其实InnoDB表性能还不错而且数据安全也有保障。而内存表由于不支持行锁更新语句会阻塞查询性能也未必就如想象中那么好。
基于内存表的特性我们还分析了它的一个适用场景就是内存临时表。内存表支持hash索引这个特性利用起来对复杂查询的加速效果还是很不错的。
最后,我给你留一个问题吧。
假设你刚刚接手的一个数据库上真的发现了一个内存表。备库重启之后肯定是会导致备库的内存表数据被清空进而导致主备同步停止。这时最好的做法是将它修改成InnoDB引擎表。
假设当时的业务场景暂时不允许你修改引擎,你可以加上什么自动化逻辑,来避免主备同步停止呢?
你可以把你的思考和分析写在评论区,我会在下一篇文章的末尾跟你讨论这个问题。感谢你的收听,也欢迎你把这篇文章分享给更多的朋友一起阅读。
# 上期问题时间
今天文章的正文内容,已经回答了我们上期的问题,这里就不再赘述了。
评论区留言点赞板:
> @老杨同志、@poppy、@长杰 这三位同学给出了正确答案,春节期间还持续保持跟进学习,给你们点赞。