MySQL中逻辑架构、引擎介绍及工作流程
逻辑架构
架构概览
和其它数据库相比,MySQL 有点与众不同,它的架构可以在多种不同场景中应用并发挥良好作用。
主要体现在存储引擎的架构上,插件式的存储引擎架构将查询处理和其它的系统任务以及数据的存储提取相分离。
这种架构可以根据业务的需求和实际需要选择合适的存储引擎。
1、连接层
最上层是一些客户端和连接服务,包含本地 sock 通信和大多数基于客户端/服务端工具实现的类似于 tcp/ip 的通信。
主要完成一些类似于连接处理、授权认证、及相关的安全方案。
在该层上引入了线程池的概念,为通过认证安全接入的客户端提供线程。
同样在该层上可以实现基于 SSL 的安全链接。服务器也会为安全接入的每个客户端验证它所具有的操作权限。
2、服务层
第二层架构主要完成大多数的核心服务功能,如 SQL 接口,并完成缓存的查询,SQL 的分析和优化及部分内置函数的执行。
所有跨存储引擎的功能也在这一层实现,如过程、函数等。
在该层,服务器会解析查询并创建相应的内部解析树,并对其完成相应的优化:如确定查询表的顺序,是否利用索引等,最后生成相应的执行操作。
如果是 select 语句,服务器还会查询内部的缓存。如果缓存空间足够大,这样在解决大量读操作的环境中能够很好的提升系统的性能。
SQL Interface:SQL 接口
- 接受用户的 SQL 命令,并且返回用户需要查询的结果。比如
select from
就是调用SQL Interface
Parser:解析器
- SQL 命令传递到解析器的时候会被解析器验证和解析。
Optimizer:查询优化器
- SQL 语句在查询之前会使用查询优化器对查询进行优化。
- 优化器来决定先投影还是先过滤。
Cache&Buffer:查询缓存
- 如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据。
- 这个缓存机制是由一系列小缓存组成的。比如表缓存,记录缓存,key 缓存,权限缓存等
3、引擎层
存储引擎层,存储引擎真正的负责了 MySQL 中数据的存储和提取,服务器通过 API 与存储引擎进行通信。不同的存储引擎具有的功能不同,这样我们可以根据自己的实际需要进行选取。
4、存储层
数据存储层,主要是将数据存储在运行于裸设备的文件系统之上,并完成与存储引擎的交互。
存储引擎
1、查看存储引擎
查看 mysql 提供什么存储引擎:
1 | show engines; |
查看默认的存储引擎:
1 | show variables like '%storage_engine%'; |
引擎介绍
1、InnoDB
- MySQL 大于等于 5.5 之后,默认采用 InnoDB 引擎。
- InnoDB 是 MySQL 的默认事务型引擎,它被设计用来处理大量的短期(short-lived)事务。可以确保事务的完整提交(Commit)和回滚(Rollback)。
- 除了增加和查询外,还需要更新,删除操作,那么,应优选选择 InnoDB 存储引擎。
- 除非有非常特别的原因需要使用其他的存储引擎,否则应该优先考虑 InnoDB 引擎。
2、MyISAM
- MyISAM 提供了大量的特性,包括全文索引、压缩、空间函数(GIS)等,但 MyISAM 不支持事务和行级锁,有一个毫无疑问的缺陷就是崩溃后无法安全恢复。
- MySQL5.5 之前默认的存储引擎
- 数据文件结构:
- .frm 存储定义表
- .MYD 存储数据
- .MYI 存储索引
特别注意
静态表字段都是非变长字段,存储占用空间比动态表多。存储数据时会按照列宽补足空格,但在访问时候并不会得到这些空格。
如果存储数据本身后面有空格,那么,查询时也会被去掉(InnoDB 查询时则不会被去掉)。
如果存储数据本身前面有空格,则查询时不会被去掉(InnoDB 查询时不会被去掉)。
在没有 where 条件情况下统计表 count(*)数量,不需要全表扫描,而是直接获取保存好的值。
3、Archive
- Archive 档案存储引擎只支持INSERT和SELECT操作,在 MySQL5.1 之前不支持索引。
- Archive 表适合日志和数据采集(档案)类应用。
- 根据英文的测试结论来看,Archive 表比 MyISAM 表要小大约 75%,比支持事务处理的 InnoDB 表小大约 83%。
4、Blackhole
- Blackhole 引擎没有实现任何存储机制,它会丢弃所有插入的数据,不做任何保存。
- 但服务器会记录 Blackhole 表的日志,所以可以用于复制数据到备库,或者简单地记录到日志。但这种应用方式会碰到很多问题,因此并不推荐。
- 主要用途:通过 Blackhole 引擎写入大量数据测试 mysql 性能
5、CSV
- CSV 引擎可以将普通的 CSV 文件作为 MySQL 的表来处理,但不支持索引。
- CSV 引擎可以作为一种数据交换的机制,非常有用。
- CSV 存储的数据直接可以在操作系统里,用文本编辑器,或者 excel 读取。
6、Memory 引擎
- 如果需要快速地访问数据,并且这些数据不会被修改,重启以后丢失也没有关系,那么使用 Memory 表是非常有用。
- Memory 表至少比 MyISAM 表要快一个数量级。
7、Federated 引擎
- Federated 引擎是访问其他 MySQL 服务器的一个代理,尽管该引擎看起来提供了一种很好的跨服务器的灵活性,但也经常带来问题,因此默认是禁用的。
MyISAM 和 InnoDB 的对比
对比项 | MyISAM | InnoDB |
---|---|---|
外键 | 不支持 | 支持 |
事务 | 不支持 | 支持 |
行表锁 | 表锁,即使操作一条记录也会锁住整个表,不适合高并发的操作 | 行锁,操作时只锁某一行,不对其它行有影响,适合高并发的操作 |
缓存 | 只缓存索引,不缓存真实数据 | 不仅缓存索引还要缓存真实数据,对内存要求较高,而且内存大小对性能有决定性的影响 |
自带系统表使用 | 支持 | 不支持 |
关注点 | 性能:节省资源、消耗少、简单业务 | 事务:并发写、事务、更大资源 |
默认安装 | 支持 | 支持 |
默认使用 | 不支持 | 支持 |
mysql 的查询流程
首先,mysql 客户端通过协议与 mysql 服务器建连接,发送查询语句,先检查查询缓存,如果命中,直接返回结果,否则进行语句解析,也就是说,在解析查询之前,服务器会先访问查询缓存(query cache)——它存储 SELECT 语句以及相应的查询结果集。
如果某个查询结果已经位于缓存中,服务器就不会再对查询进行解析、优化、以及执行。它仅仅将缓存中的结果返回给用户即可,这将大大提高系统的性能。
语法解析器和预处理:首先 mysql 通过关键字将 SQL 语句进行解析,并生成一颗对应的“解析树”。
mysql 解析器将使用 mysql 语法规则验证和解析查询;
预处理器则根据一些 mysql 规则进一步检查解析树是否合法。
查询优化器当解析树被认为是合法的了,并且由优化器将其转化成执行计划。
一条查询可以有很多种执行方式,最后都返回相同的结果。优化器的作用就是找到这其中最好的执行计划。
mysql 默认使用的 BTREE 索引,并且一个大致方向是:无论怎么折腾 sql,至少在目前来说,mysql 最多只用到表中的一个索引。
简单来说:当客户端发送一条查询给服务器,服务器先会查询缓存,如果命中了缓存,则立即返回存储在缓存中的结果,否则会由服务器端进行 SQL 解析和预处理,再由优化器生成对应的执行计划,最后 MySQL 根据优化器生成的执行计划,调用存储引擎来执行查询,并将结果返回给客户端。