了解MyCat

什么是 MyCat

当对数据拆分后会产生诸多的问题，对于这些问题的解决，可以借助于数据库中间件来进行解决，现在时下比较流行的是使用 Mycat。

Mycat 是一款数据库中间件，对于应用程序来说是完全透明化的，不管底层的数据如何拆分，应用只需要连接 Mycat 即可完成对数据的操作。同时它还支持 MySQL、SQL Server、Oracle、DB2、PostgreSQL 等主流数据库。但是 Mycat 不会进行数据存储，它只是用于数据的路由。

一个彻底开源的，面向企业应用开发的“大数据库集群”
支持事务、ACID、可以替代 Mysql 的加强版数据库
一个可以视为“Mysql”集群的企业级数据库，用来替代昂贵的 Oracle 集群
一个融合内存缓存技术、Nosql 技术、HDFS 大数据的新型 SQL Server
结合传统数据库和新型分布式数据仓库的新一代企业级数据库产品
一个数据库中间件产品

MyCAT 的目标是：低成本的将现有的单机数据库和应用平滑迁移到“云”端，解决数据存储和业务规模迅速增长情况下的数据瓶颈问题。

MyCat 特性

支持 SQL92 标准
遵守 Mysql 原生协议，跨语言，跨平台，跨数据库的通用中间件代理
基于心跳的自动故障切换，支持读写分离，支持 MySQL 主从，以及 galera cluster 集群
支持 Galera for MySQL 集群，Percona Cluster 或者 MariaDB cluster
基于 Nio 实现，有效管理线程，高并发问题
支持数据的多片自动路由与聚合，支持 sum,count,max 等常用的聚合函数
支持单库内部任意 join，支持跨库 2 表 join
支持通过全局表，ER 关系的分片策略，实现了高效的多表 join 查询
支持多租户方案
支持分布式事务
支持全局序列号，解决分布式下的主键生成问题
分片规则丰富，插件化开发，易于扩展
强大的 web，命令行监控
支持前端作为 mysq 通用代理，后端 JDBC 方式支持 Oracle、DB2、SQL Server 、 mongodb
支持密码加密
支持服务降级
支持 IP 白名单
支持 SQL 黑名单、sql 注入攻击拦截
支持分表(1.6 以后版本)
集群基于 ZooKeeper 管理，在线升级，扩容，智能优化，大数据处理（2.0 以后版本）

MyCat 核心概念

逻辑库：Mycat 中的虚拟数据库。对应实际数据库的概念。在没有使用 mycat 时，应用需要确定当前连接的数据库等信息，那么当使用 mycat 后，也需要先虚拟一个数据库，用于应用的连接。
逻辑表：mycat 中的虚拟数据表。对应时间数据库中数据表的概念。
非分片表：没有进行数据切分的表。
分片表：已经被数据拆分的表，每个分片表中都有原有数据表的一部分数据。多张分片表可以构成一个完整数据表。
ER 表：子表的记录与所关联的父表记录存放在同一个数据分片上，即子表依赖于父表，通过表分组（Table Group）保证数据 Join 不会跨库操作。表分组（Table Group）是解决跨分片数据 join 的一种很好的思路，也是数据切分规划的重要一条规则
全局表：可以理解为是一张数据冗余表，如状态表，每一个数据分片节点又保存了一份状态表数据。数据冗余是解决跨分片数据 join 的一种很好的思路，也是数据切分规划的另外一条重要规则。
分片节点（dataNode）：数据切分后，每一个数据分片表所在的数据库就是分片节点。
节点主机（dataHost）：数据切分后，每个分片节点（dataNode）不一定都会独占一台机器，同一机器上面可以有多个分片数据库，这样一个或多个分片节点（dataNode）所在的机器就是节点主机（dataHost）,为了规避单节点主机并发数限制，尽量将读写压力高的分片节点（dataNode）均衡的放在不同的节点主机（dataHost）。
分片规则（rule）：按照某种业务规则把数据分到某个分片的规则就是分片规则。
全局序列号（sequence）：也可以理解为分布式 id。数据切分后，原有的关系数据库中的主键约束在分布式条件下将无法使用，因此需要引入外部机制保证数据唯一性标识，这种保证全局性的数据唯一标识的机制就是全局序列号（sequence），如 UUID、雪花算法等。