MyCat | 分库分表实践-白红宇

MyCat | 分库分表实践

阅读量：5976 次

发布时间：2019-06-20

本文共 3531 字，大约阅读时间需要 11 分钟。

引言

先给大家介绍2个概念：数据的切分（Sharding）根据其切分规则的类型，可以分为两种切分模式。

切分模式

一种是按照不同的表（或者Schema）来切分到不同的数据库（主机）之上，这种切可以称之为数据的垂直（纵向）切分；另外一种则是根据表中的数据的逻辑关系，将同一个表中的数据按照某种条件拆分到多台数据库（主机）上面，这种切分称之为数据的水平（横向）切分。

垂直切分的最大特点就是规则简单，实施也更为方便，尤其适合各业务之间的耦合度非常低，相互影响很小，业务逻辑非常清晰的系统。在这种系统中，可以很容易做到将不同业务模块所使用的表分拆到不同的数据库中。根据不同的表来进行拆分，对应用程序的影响也更小，拆分规则也会比较简单清晰。

水平切分于垂直切分相比，相对来说稍微复杂一些。因为要将同一个表中的不同数据拆分到不同的数据库中，对于应用程序来说，拆分规则本身就较根据表名来拆分更为复杂，后期的数据维护也会更为复杂一些。

为什么用MyCat

不管怎么来说，数据切分虽然分散了单台服务器负载，但是带来了是设计和开发的复杂度。MyCat是一个开源的分布式数据库中间件，实现了MySQL协议的服务器，前端用户可以把它看作是一个数据库代理，用MySQL客户端工具和命令行访问，而其后端可以用MySQL原生协议与多个MySQL服务器通信，在MyCat里，我们面向的是一个传统的数据库表，支持标准的SQL语句进行数据的操作，这样一来，对前端业务系统来说，可以大幅降低开发难度，提升开发速度。

分库分表实践

基本环境

操作系统：CentOS / 7.1 (64bit)

JDK：1.8

MySQL：5.7

MyCat：1.6

业务目标

比如说我们现在有个实际的业务上设计需求，要将student和grade表进行垂直划分，分别存储不同的database中；还需要将student水平拆分，也要3个不同database存分别储。如下图所示，MyCat可以帮助实现这4个database的管理，而对于终端用户来说，就像只操作student和grade两张表，保证了中间件分库分页对程序员的透明性。

创建实际数据库

首先，我们肯定需要创建4个database：beijing、shanghai、guangzhou、basic，并生成对应的表。可以看出，student和grade表存在于不同的数据库，而且student表中的数据，分散存储在3个不同的数据库中：

create database beijing;use beijing;create table student(    id    int primary key,    name   varchar(8) not null,    grade  int  not null);create database shanghai;use shanghai;create table student(    id    int primary key,    name   varchar(8) not null,    grade  int  not null);create database guangzhou;use guangzhou;create table student(    id    int primary key,    name   varchar(8) not null,    grade  int  not null);create database basic;use basic;create table grade(    id    int primary key,    name   varchar(8) not null);

安装配置MyCat

比较简单，下载，直接解压缩即可。

为了方便，将/mycat/bin目录添加到环境变量：

/etc/profile文件后增加设置export PATH=/data/mycat/bin:$PATH

让profile立即生效：

# source /etc/profile

配置server

编辑\mycat\conf\server.xml：

这里MyCat会帮助我们生成一个虚拟的逻辑database，我们命名为TESTDB，并设置可以访问的用户名和密码，默认访问的端口号8066，其实MyCat还会提供一个管理端口：9066，方便我们对MyCat管理和监测，这个我们以后有机会再说。

配置schema

编辑\mycat\conf\schema.xml：


        
             
              
      
        
      
    
         
         
         
         
         
         
             
      
       select user()

schema是比较重要的一块配置，主要维护了虚拟库与实际库的映射关系：

可以看到，虚拟的逻辑库TESTDB中维护了2张表student和grade；

grade对应存储在实际的数据库节点dn4,也就是basic；

而student被拆分为存储在3个实际的数据库节点，分别是beijing、shanghai、guangzhou，分片的算法取模，根据取模映射到不同的节点；

最后，我们将实际的访问地址、访问权限配置完成，当然，这里还可以配置主从/读写分离配置，这块不是本文讨论的重点，我们以后单独说。

启动MyCat

这时候，我们敲入命令：# mycat start ，正常的话可以启动MyCat，输入# mycat status，可以查看是否运行正常，如果运行停止，证明启动有误，可以进入控制台启动，# mycat console，进行调试。（有可能报内存错误，一般是由于配置java虚拟机的默认大小的问题，我们可以根据命令行的提示，去wrapper.conf中修改）

MyCat插入和查询

MyCat启动后，我们就可以连接MyCat帮我们生成的逻辑库了：

# mysql -utest -ptest -h127.0.0.1 -P8066 -DTESTDB

接下来，我们在逻辑库中插入一下数据验证一下：

insert into grade (id,name) values (1,'一年级');insert into grade (id,name) values (2,'二年级');insert into grade (id,name) values (3,'三年级');insert into student (id,name,grade) values (1,'张三',2);insert into student (id,name,grade) values (2,'李四',1);insert into student (id,name,grade) values (3,'王五',3);insert into student (id,name,grade) values (4,'甲',3);insert into student (id,name,grade) values (5,'乙',2);insert into student (id,name,grade) values (6,'丙',1);

我们插入了6条student记录，这时应该根据不同的取模结果，存在不同的实际数据库的student表中，所以我们切换到实际数据库:# mysql -uroot -ppassword

分别查看实际数据库：