基于Docker结合Canal实现MySQL实时增量数据传输功能-巨人网络通讯

主页 > 知识库 > 基于Docker结合Canal实现MySQL实时增量数据传输功能

基于Docker结合Canal实现MySQL实时增量数据传输功能

Canal的介绍

Canal的历史由来

在早期的时候，阿里巴巴公司因为杭州和美国两个地方的机房都部署了数据库实例，但因为跨机房同步数据的业务需求，便孕育而生出了Canal，主要是基于trigger（触发器）的方式获取增量变更。从2010年开始，阿里巴巴公司开始逐步尝试数据库日志解析，获取增量变更的数据进行同步，由此衍生出了增量订阅和消费业务。

当前的Canal支持的数据源端MySQL版本包括：5.1.x 、5.5.x 、5.6.x、5.7.x、8.0.x。

Canal的应用场景

目前普遍基于日志增量订阅和消费的业务，主要包括：

基于数据库增量日志解析，提供增量数据订阅和消费
数据库镜像数据库实时备份
索引构建和实时维护（拆分异构索引、倒排索引等）
业务Cache刷新
带业务逻辑的增量数据处理
Canal的工作原理

在介绍Canal的原理之前，我们先来了解下MySQL主从复制的原理。

MySQL主从复制原理

MySQL Master将数据变更的操作写入二进制日志binary log中，其中记录的内容叫做二进制日志事件binary log events，可以通过show binlog events命令进行查看
MySQL Slave会将Master的binary log中的binary log events拷贝到它的中继日志relay log
MySQL Slave重读并执行relay log中的事件，将数据变更映射到它自己的数据库表中

了解了MySQL的工作原理，我们可以大致猜想到Canal应该也是采用类似的逻辑去实现增量数据订阅的功能，那么接下来我们看看实际上Canal的工作原理是怎样的？

Canal工作原理

Canal模拟MySQL Slave的交互协议，伪装自己为MySQL Slave，向MySQL Master发送dump协议
MySQL Master收到dump请求，开始推送binary log给Slave（也就是Canal）
Canal解析binary log对象（数据为byte流）

基于这样的原理与方式，便可以完成数据库增量日志的获取解析，提供增量数据订阅和消费，实现MySQL实时增量数据传输的功能。

既然Canal是这样的一个框架，又是纯Java语言编写而成，那么我们接下来就开始学习怎么使用它并把它用到我们的实际工作中。

Canal的Docker环境准备

因为目前容器化技术的火热，本文通过使用Docker来快速搭建开发环境，而传统方式的环境搭建，在我们学会了Docker容器环境搭建后，也能自行依葫芦画瓢搭建成功。由于本篇主要讲解Canal，所以关于Docker的内容不会涉及太多，主要会介绍Docker的基本概念和命令使用。如果你想和更多容器技术专家交流，可以加我微信liyingjiese，备注『加群』。群里每周都有全球各大公司的最佳实践以及行业最新动态。

什么是Docker

相信绝大多数人都使用过虚拟机VMware，在使用VMware进行环境搭建的时候，只需提供了一个普通的系统镜像并成功安装，剩下的软件环境与应用配置还是如我们在本机操作一样在虚拟机里也操作一遍，而且VMware占用宿主机的资源较多，容易造成宿主机卡顿，而且系统镜像本身也占用过多空间。

为了便于大家快速理解Docker，便与VMware做对比来做介绍，Docker提供了一个开始，打包，运行APP的平台，把APP（应用）和底层infrastructure（基础设施）隔离开来。Docker中最主要的两个概念就是镜像（类似VMware的系统镜像）与容器（类似VMware里安装的系统）。

什么是Image（镜像）

文件和meta data的集合（root filesystem）
分层的，并且每一层都可以添加改变删除文件，成为一个新的image
不同的image可以共享相同的layer
Image本身是read-only的

什么是Container（容器）

通过Image创建（copy）
在Image layer之上建立一个container layer（可读写）
类比面向对象：类和实例
Image负责APP的存储和分发，Container负责运行APP

Docker的网络介绍

Docker的网络类型有三种：

Bridge：桥接网络。默认情况下启动的Docker容器，都是使用Bridge，Docker安装时创建的桥接网络，每次Docker容器重启时，会按照顺序获取对应的IP地址，这个就导致重启下，Docker的IP地址就变了。
None：无指定网络。使用 --network=none，Docker容器就不会分配局域网的IP。
Host：主机网络。使用--network=host，此时，Docker容器的网络会附属在主机上，两者是互通的。例如，在容器中运行一个Web服务，监听8080端口，则主机的8080端口就会自动映射到容器中。

创建自定义网络：（设置固定IP）

docker network create --subnet=172.18.0.0/16 mynetwork

查看存在的网络类型docker network ls：

搭建Canal环境

附上Docker的下载安装地址==> Docker Download 。

下载Canal镜像docker pull canal/canal-server：

下载MySQL镜像docker pull mysql，下载过的则如下图：

查看已经下载好的镜像docker images：

接下来通过镜像生成MySQL容器与canal-server容器：

##生成mysql容器
docker run -d --name mysql --net mynetwork --ip 172.18.0.6 -p 3306:3306 -e MYSQL_ROOT_PASSWORD=root mysql
##生成canal-server容器
docker run -d --name canal-server --net mynetwork --ip 172.18.0.4 -p 11111:11111 canal/canal-server
## 命令介绍
--net mynetwork #使用自定义网络
--ip #指定分配ip

查看Docker中运行的容器docker ps：

MySQL的配置修改

以上只是初步准备好了基础的环境，但是怎么让Canal伪装成Salve并正确获取MySQL中的binary log呢？

对于自建MySQL，需要先开启Binlog写入功能，配置binlog-format为ROW模式，通过修改MySQL配置文件来开启bin_log，使用find / -name my.cnf查找my.cnf，修改文件内容如下：

[mysqld]
log-bin=mysql-bin # 开启binlog
binlog-format=ROW # 选择ROW模式
server_id=1 # 配置MySQL replaction需要定义，不要和Canal的slaveId重复

进入MySQL容器docker exec -it mysql bash。

创建链接MySQL的账号Canal并授予作为MySQL slave的权限，如果已有账户可直接GRANT：

mysql -uroot -proot
# 创建账号
CREATE USER canal IDENTIFIED BY 'canal'; 
# 授予权限
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';
-- GRANT ALL PRIVILEGES ON *.* TO 'canal'@'%' ;
# 刷新并应用
FLUSH PRIVILEGES;

数据库重启后，简单测试 my.cnf 配置是否生效：

show variables like 'log_bin';
show variables like 'log_bin';
show master status;

canal-server的配置修改

进入canal-server容器docker exec -it canal-server bash。

编辑canal-server的配置vi canal-server/conf/example/instance.properties：

更多配置请参考==>Canal配置说明。

重启canal-server容器docker restart canal-server 进入容器查看启动日志：

docker exec -it canal-server bash
tail -100f canal-server/logs/example/example.log

至此，我们的环境工作准备完成！

拉取数据并同步保存到ElasticSearch

本文的ElasticSearch也是基于Docker环境搭建，所以读者可执行如下命令：

# 下载对镜像
docker pull elasticsearch:7.1.1
docker pull mobz/elasticsearch-head:5-alpine
# 创建容器并运行
docker run -d --name elasticsearch --net mynetwork --ip 172.18.0.2 -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" elasticsearch:7.1.1
docker run -d --name elasticsearch-head --net mynetwork --ip 172.18.0.5 -p 9100:9100 mobz/elasticsearch-head:5-alpine

环境已经准备好了，现在就要开始我们的编码实战部分了，怎么通过应用程序去获取Canal解析后的binlog数据。首先我们基于Spring Boot搭建一个canal demo应用。结构如下图所示：

Student.java

package com.example.canal.study.pojo;
import lombok.Data;
import java.io.Serializable;
// @Data 用户生产getter、setter方法
@Data
public class Student implements Serializable {
private String id;
private String name;
private int age;
private String sex;
private String city;
}

CanalConfig.java

package com.example.canal.study.common;
import com.alibaba.otter.canal.client.CanalConnector;
import com.alibaba.otter.canal.client.CanalConnectors;
import org.apache.http.HttpHost;
import org.elasticsearch.client.RestClient;
import org.elasticsearch.client.RestHighLevelClient;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import java.net.InetSocketAddress;
/**
* @author haha
*/
@Configuration
public class CanalConfig {
// @Value 获取 application.properties配置中端内容
@Value("${canal.server.ip}")
private String canalIp;
@Value("${canal.server.port}")
private Integer canalPort;
@Value("${canal.destination}")
private String destination;
@Value("${elasticSearch.server.ip}")
private String elasticSearchIp;
@Value("${elasticSearch.server.port}")
private Integer elasticSearchPort;
@Value("${zookeeper.server.ip}")
private String zkServerIp;
// 获取简单canal-server连接
@Bean
public CanalConnector canalSimpleConnector() {
 CanalConnector canalConnector = CanalConnectors.newSingleConnector(new InetSocketAddress(canalIp, canalPort), destination, "", "");
 return canalConnector;
}
// 通过连接zookeeper获取canal-server连接
@Bean
public CanalConnector canalHaConnector() {
 CanalConnector canalConnector = CanalConnectors.newClusterConnector(zkServerIp, destination, "", "");
 return canalConnector;
}
// elasticsearch 7.x客户端
@Bean
public RestHighLevelClient restHighLevelClient() {
 RestHighLevelClient client = new RestHighLevelClient(
   RestClient.builder(new HttpHost(elasticSearchIp, elasticSearchPort))
 );
 return client;
}
}

CanalDataParser.java

由于这个类的代码较多，文中则摘出其中比较重要的部分，其它部分代码可从GitHub上获取：

public static class TwoTuple<A, B> {
 public final A eventType;
 public final B columnMap;
 public TwoTuple(A a, B b) {
  eventType = a;
  columnMap = b;
 }
}
public static List<TwoTuple<EventType, Map>> printEntry(List<Entry> entrys) {
 List<TwoTuple<EventType, Map>> rows = new ArrayList<>();
 for (Entry entry : entrys) {
  // binlog event的事件事件
  long executeTime = entry.getHeader().getExecuteTime();
  // 当前应用获取到该binlog锁延迟的时间
  long delayTime = System.currentTimeMillis() - executeTime;
  Date date = new Date(entry.getHeader().getExecuteTime());
  SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
  // 当前的entry（binary log event）的条目类型属于事务
  if (entry.getEntryType() == EntryType.TRANSACTIONBEGIN || entry.getEntryType() == EntryType.TRANSACTIONEND) {
   if (entry.getEntryType() == EntryType.TRANSACTIONBEGIN) {
    TransactionBegin begin = null;
    try {
     begin = TransactionBegin.parseFrom(entry.getStoreValue());
    } catch (InvalidProtocolBufferException e) {
     throw new RuntimeException("parse event has an error , data:" + entry.toString(), e);
    }
    // 打印事务头信息，执行的线程id，事务耗时
    logger.info(transaction_format,
      new Object[]{entry.getHeader().getLogfileName(),
        String.valueOf(entry.getHeader().getLogfileOffset()),
        String.valueOf(entry.getHeader().getExecuteTime()),
        simpleDateFormat.format(date),
        entry.getHeader().getGtid(),
        String.valueOf(delayTime)});
    logger.info(" BEGIN ----> Thread id: {}", begin.getThreadId());
    printXAInfo(begin.getPropsList());
   } else if (entry.getEntryType() == EntryType.TRANSACTIONEND) {
    TransactionEnd end = null;
    try {
     end = TransactionEnd.parseFrom(entry.getStoreValue());
    } catch (InvalidProtocolBufferException e) {
     throw new RuntimeException("parse event has an error , data:" + entry.toString(), e);
    }
    // 打印事务提交信息，事务id
    logger.info("----------------\n");
    logger.info(" END ----> transaction id: {}", end.getTransactionId());
    printXAInfo(end.getPropsList());
    logger.info(transaction_format,
      new Object[]{entry.getHeader().getLogfileName(),
        String.valueOf(entry.getHeader().getLogfileOffset()),
        String.valueOf(entry.getHeader().getExecuteTime()), simpleDateFormat.format(date),
        entry.getHeader().getGtid(), String.valueOf(delayTime)});
   }
   continue;
  }
  // 当前entry（binary log event）的条目类型属于原始数据
  if (entry.getEntryType() == EntryType.ROWDATA) {
   RowChange rowChage = null;
   try {
    // 获取储存的内容
    rowChage = RowChange.parseFrom(entry.getStoreValue());
   } catch (Exception e) {
    throw new RuntimeException("parse event has an error , data:" + entry.toString(), e);
   }
   // 获取当前内容的事件类型
   EventType eventType = rowChage.getEventType();
   logger.info(row_format,
     new Object[]{entry.getHeader().getLogfileName(),
       String.valueOf(entry.getHeader().getLogfileOffset()), entry.getHeader().getSchemaName(),
       entry.getHeader().getTableName(), eventType,
       String.valueOf(entry.getHeader().getExecuteTime()), simpleDateFormat.format(date),
       entry.getHeader().getGtid(), String.valueOf(delayTime)});
   // 事件类型是query或数据定义语言DDL直接打印sql语句，跳出继续下一次循环
   if (eventType == EventType.QUERY || rowChage.getIsDdl()) {
    logger.info(" sql ----> " + rowChage.getSql() + SEP);
    continue;
   }
   printXAInfo(rowChage.getPropsList());
   // 循环当前内容条目的具体数据
   for (RowData rowData : rowChage.getRowDatasList()) {
    List<CanalEntry.Column> columns;
    // 事件类型是delete返回删除前的列内容，否则返回改变后列的内容
    if (eventType == CanalEntry.EventType.DELETE) {
     columns = rowData.getBeforeColumnsList();
    } else {
     columns = rowData.getAfterColumnsList();
    }
    HashMap<String, Object> map = new HashMap<>(16);
    // 循环把列的name与value放入map中
    for (Column column: columns){
     map.put(column.getName(), column.getValue());
    }
    rows.add(new TwoTuple<>(eventType, map));
   }
  }
 }
 return rows;
}

ElasticUtils.java

package com.example.canal.study.common;
import com.alibaba.fastjson.JSON;
import com.example.canal.study.pojo.Student;
import lombok.extern.slf4j.Slf4j;
import org.elasticsearch.client.RestHighLevelClient;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Component;
import org.elasticsearch.action.DocWriteRequest;
import org.elasticsearch.action.delete.DeleteRequest;
import org.elasticsearch.action.delete.DeleteResponse;
import org.elasticsearch.action.get.GetRequest;
import org.elasticsearch.action.get.GetResponse;
import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.action.index.IndexResponse;
import org.elasticsearch.action.update.UpdateRequest;
import org.elasticsearch.action.update.UpdateResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.common.xcontent.XContentType;
import java.io.IOException;
import java.util.Map;
/**
* @author haha
*/
@Slf4j
@Component
public class ElasticUtils {
@Autowired
private RestHighLevelClient restHighLevelClient;
/**
 * 新增
 * @param student 
 * @param index 索引
 */
public void saveEs(Student student, String index) {
 IndexRequest indexRequest = new IndexRequest(index)
   .id(student.getId())
   .source(JSON.toJSONString(student), XContentType.JSON)
   .opType(DocWriteRequest.OpType.CREATE);
 try {
  IndexResponse response = restHighLevelClient.index(indexRequest, RequestOptions.DEFAULT);
  log.info("保存数据至ElasticSearch成功：{}", response.getId());
 } catch (IOException e) {
  log.error("保存数据至elasticSearch失败: {}", e);
 }
}
/**
 * 查看
 * @param index 索引
 * @param id _id
 * @throws IOException
 */
public void getEs(String index, String id) throws IOException {
 GetRequest getRequest = new GetRequest(index, id);
 GetResponse response = restHighLevelClient.get(getRequest, RequestOptions.DEFAULT);
 Map<String, Object> fields = response.getSource();
 for (Map.Entry<String, Object> entry : fields.entrySet()) {
  System.out.println(entry.getKey() + ":" + entry.getValue());
 }
}
/**
 * 更新
 * @param student
 * @param index 索引
 * @throws IOException
 */
public void updateEs(Student student, String index) throws IOException {
 UpdateRequest updateRequest = new UpdateRequest(index, student.getId());
 updateRequest.upsert(JSON.toJSONString(student), XContentType.JSON);
 UpdateResponse response = restHighLevelClient.update(updateRequest, RequestOptions.DEFAULT);
 log.info("更新数据至ElasticSearch成功：{}", response.getId());
}
/**
 * 根据id删除数据
 * @param index 索引
 * @param id _id
 * @throws IOException
 */
public void DeleteEs(String index, String id) throws IOException {
 DeleteRequest deleteRequest = new DeleteRequest(index, id);
 DeleteResponse response = restHighLevelClient.delete(deleteRequest, RequestOptions.DEFAULT);
 log.info("删除数据至ElasticSearch成功：{}", response.getId());
}
}

BinLogElasticSearch.java

package com.example.canal.study.action;
import com.alibaba.otter.canal.client.CanalConnector;
import com.alibaba.otter.canal.protocol.CanalEntry;
import com.alibaba.otter.canal.protocol.Message;
import com.example.canal.study.common.CanalDataParser;
import com.example.canal.study.common.ElasticUtils;
import com.example.canal.study.pojo.Student;
import lombok.extern.slf4j.Slf4j;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.beans.factory.annotation.Qualifier;
import org.springframework.stereotype.Component;
import java.io.IOException;
import java.util.List;
import java.util.Map;
/**
* @author haha
*/
@Slf4j
@Component
public class BinLogElasticSearch {
@Autowired
private CanalConnector canalSimpleConnector;
@Autowired
private ElasticUtils elasticUtils;
//@Qualifier("canalHaConnector")使用名为canalHaConnector的bean
@Autowired
@Qualifier("canalHaConnector")
private CanalConnector canalHaConnector;
public void binLogToElasticSearch() throws IOException {
 openCanalConnector(canalHaConnector);
 // 轮询拉取数据
 Integer batchSize = 5 * 1024;
 while (true) {
  Message message = canalHaConnector.getWithoutAck(batchSize);
//   Message message = canalSimpleConnector.getWithoutAck(batchSize);
  long id = message.getId();
  int size = message.getEntries().size();
  log.info("当前监控到binLog消息数量{}", size);
  if (id == -1 || size == 0) {
   try {
    // 等待2秒
    Thread.sleep(2000);
   } catch (InterruptedException e) {
    e.printStackTrace();
   }
  } else {
   //1. 解析message对象
   List<CanalEntry.Entry> entries = message.getEntries();
   List<CanalDataParser.TwoTuple<CanalEntry.EventType, Map>> rows = CanalDataParser.printEntry(entries);
   for (CanalDataParser.TwoTuple<CanalEntry.EventType, Map> tuple : rows) {
    if(tuple.eventType == CanalEntry.EventType.INSERT) {
     Student student = createStudent(tuple);
     // 2。将解析出的对象同步到elasticSearch中
     elasticUtils.saveEs(student, "student_index");
     // 3.消息确认已处理
//     canalSimpleConnector.ack(id);
     canalHaConnector.ack(id);
    }
    if(tuple.eventType == CanalEntry.EventType.UPDATE){
     Student student = createStudent(tuple);
     elasticUtils.updateEs(student, "student_index");
     // 3.消息确认已处理
//     canalSimpleConnector.ack(id);
     canalHaConnector.ack(id);
    }
    if(tuple.eventType == CanalEntry.EventType.DELETE){
     elasticUtils.DeleteEs("student_index", tuple.columnMap.get("id").toString());
     canalHaConnector.ack(id);
    }
   }
  }
 }
}
/**
 * 封装数据至Student
 * @param tuple
 * @return
 */
private Student createStudent(CanalDataParser.TwoTuple<CanalEntry.EventType, Map> tuple){
 Student student = new Student();
 student.setId(tuple.columnMap.get("id").toString());
 student.setAge(Integer.parseInt(tuple.columnMap.get("age").toString()));
 student.setName(tuple.columnMap.get("name").toString());
 student.setSex(tuple.columnMap.get("sex").toString());
 student.setCity(tuple.columnMap.get("city").toString());
 return student;
}
/**
 * 打开canal连接
 *
 * @param canalConnector
 */
private void openCanalConnector(CanalConnector canalConnector) {
 //连接CanalServer
 canalConnector.connect();
 // 订阅destination
 canalConnector.subscribe();
}
/**
 * 关闭canal连接
 *
 * @param canalConnector
 */
private void closeCanalConnector(CanalConnector canalConnector) {
 //关闭连接CanalServer
 canalConnector.disconnect();
 // 注销订阅destination
 canalConnector.unsubscribe();
}
}

CanalDemoApplication.java（Spring Boot启动类）

package com.example.canal.study;
import com.example.canal.study.action.BinLogElasticSearch;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.ApplicationArguments;
import org.springframework.boot.ApplicationRunner;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
/**
* @author haha
*/
@SpringBootApplication
public class CanalDemoApplication implements ApplicationRunner {
@Autowired
private BinLogElasticSearch binLogElasticSearch;
public static void main(String[] args) {
 SpringApplication.run(CanalDemoApplication.class, args);
}
// 程序启动则执行run方法
@Override
public void run(ApplicationArguments args) throws Exception {
 binLogElasticSearch.binLogToElasticSearch();
}
}

application.properties

server.port=8081
spring.application.name = canal-demo
canal.server.ip = 192.168.124.5
canal.server.port = 11111
canal.destination = example
zookeeper.server.ip = 192.168.124.5:2181
zookeeper.sasl.client = false
elasticSearch.server.ip = 192.168.124.5
elasticSearch.server.port = 9200

Canal集群高可用的搭建

通过上面的学习，我们知道了单机直连方式的Canala应用。在当今互联网时代，单实例模式逐渐被集群高可用模式取代，那么Canala的多实例集群方式如何搭建呢！

基于ZooKeeper获取Canal实例

准备ZooKeeper的Docker镜像与容器：

docker pull zookeeper
docker run -d --name zookeeper --net mynetwork --ip 172.18.0.3 -p 2181:2181 zookeeper
docker run -d --name canal-server2 --net mynetwork --ip 172.18.0.8 -p 11113:11113 canal/canal-server

1、机器准备：

运行Canal的容器IP： 172.18.0.4 , 172.18.0.8
ZooKeeper容器IP：172.18.0.3:2181
MySQL容器IP：172.18.0.6:3306

2、按照部署和配置，在单台机器上各自完成配置，演示时instance name为example。

3、修改canal.properties，加上ZooKeeper配置并修改Canal端口：

canal.port=11113
canal.zkServers=172.18.0.3:2181
canal.instance.global.spring.xml = classpath:spring/default-instance.xml

4、创建example目录，并修改instance.properties：

canal.instance.mysql.slaveId = 1235 
#之前的canal slaveId是1234，保证slaveId不重复即可
canal.instance.master.address = 172.18.0.6:3306

注意：两台机器上的instance目录的名字需要保证完全一致，HA模式是依赖于instance name进行管理，同时必须都选择default-instance.xml配置。

启动两个不同容器的Canal，启动后，可以通过tail -100f logs/example/example.log查看启动日志，只会看到一台机器上出现了启动成功的日志。

比如我这里启动成功的是 172.18.0.4：

查看一下ZooKeeper中的节点信息，也可以知道当前工作的节点为172.18.0.4:11111：

[zk: localhost:2181(CONNECTED) 15] get /otter/canal/destinations/example/running 
{"active":true,"address":"172.18.0.4:11111","cid":1}

客户端链接, 消费数据

可以通过指定ZooKeeper地址和Canal的instance name，canal client会自动从ZooKeeper中的running节点获取当前服务的工作节点，然后与其建立链接：

[zk: localhost:2181(CONNECTED) 0] get /otter/canal/destinations/example/running
{"active":true,"address":"172.18.0.4:11111","cid":1}

对应的客户端编码可以使用如下形式，上文中的CanalConfig.java中的canalHaConnector就是一个HA连接：

CanalConnector connector = CanalConnectors.newClusterConnector("172.18.0.3:2181", "example", "", "");

链接成功后，canal server会记录当前正在工作的canal client信息，比如客户端IP，链接的端口信息等（聪明的你，应该也可以发现，canal client也可以支持HA功能）：

[zk: localhost:2181(CONNECTED) 4] get /otter/canal/destinations/example/1001/running
{"active":true,"address":"192.168.124.5:59887","clientId":1001}

数据消费成功后，canal server会在ZooKeeper中记录下当前最后一次消费成功的binlog位点（下次你重启client时，会从这最后一个位点继续进行消费）：

[zk: localhost:2181(CONNECTED) 5] get /otter/canal/destinations/example/1001/cursor

{"@type":"com.alibaba.otter.canal.protocol.position.LogPosition","identity":{"slaveId":-1,"sourceAddress":{"address":"mysql.mynetwork","port":3306}},"postion":{"included":false,"journalName":"binlog.000004","position":2169,"timestamp":1562672817000}}

停止正在工作的172.18.0.4的canal server：

docker exec -it canal-server bash
cd canal-server/bin
sh stop.sh

这时172.18.0.8会立马启动example instance，提供新的数据服务：

[zk: localhost:2181(CONNECTED) 19] get /otter/canal/destinations/example/running
{"active":true,"address":"172.18.0.8:11111","cid":1}

与此同时，客户端也会随着canal server的切换，通过获取ZooKeeper中的最新地址，与新的canal server建立链接，继续消费数据，整个过程自动完成。

异常与总结

elasticsearch-head无法访问Elasticsearch

es与es-head是两个独立的进程，当es-head访问es服务时，会存在一个跨域问题。所以我们需要修改es的配置文件，增加一些配置项来解决这个问题，如下：

[root@localhost /usr/local/elasticsearch-head-master]# cd ../elasticsearch-5.5.2/config/
[root@localhost /usr/local/elasticsearch-5.5.2/config]# vim elasticsearch.yml 
# 文件末尾加上如下配置
http.cors.enabled: true
http.cors.allow-origin: "*"

修改完配置文件后需重启es服务。

elasticsearch-head查询报406 Not Acceptable

解决方法：

1、进入head安装目录；

2、cd _site/

3、编辑vendor.js 共有两处

#6886行 contentType: "application/x-www-form-urlencoded
改成 contentType: "application/json;charset=UTF-8"
 #7574行 var inspectData = s.contentType === "application/x-www-form-urlencoded" &&
改成 var inspectData = s.contentType === "application/json;charset=UTF-8" &&

使用elasticsearch-rest-high-level-client报org.elasticsearch.action.index.IndexRequest.ifSeqNo

#pom中除了加入依赖
<dependency>
<groupId>org.elasticsearch.client</groupId>
<artifactId>elasticsearch-rest-high-level-client</artifactId>
<version>7.1.1</version>
</dependency>
#还需加入
<dependency>
<groupId>org.elasticsearch</groupId>
<artifactId>elasticsearch</artifactId>
<version>7.1.1</version>
</dependency>

相关参考： git hub issues 。

为什么ElasticSearch要在7.X版本不能使用type?

参考：为什么ElasticSearch要在7.X版本去掉type？

使用spring-data-elasticsearch.jar报org.elasticsearch.client.transport.NoNodeAvailableException

由于本文使用的是elasticsearch7.x以上的版本，目前spring-data-elasticsearch底层采用es官方TransportClient，而es官方计划放弃TransportClient，工具以es官方推荐的RestHighLevelClient进行调用请求。可参考 RestHighLevelClient API 。

设置Docker容器开启启动

如果创建时未指定 --restart=always ,可通过update 命令
docker update --restart=always [containerID]

Docker for Mac network host模式不生效

Host模式是为了性能，但是这却对Docker的隔离性造成了破坏，导致安全性降低。在性能场景下，可以用--netwokr host开启Host模式，但需要注意的是，如果你用Windows或Mac本地启动容器的话，会遇到Host模式失效的问题。原因是Host模式只支持Linux宿主机。

参见官方文档： https://docs.docker.com/network/host/ 。

客户端连接ZooKeeper报authenticate using SASL（unknow error）

zookeeper.jar与Dokcer中的ZooKeeper版本不一致
zookeeper.jar使用了3.4.6之前的版本

出现这个错的意思是ZooKeeper作为外部应用需要向系统申请资源，申请资源的时候需要通过认证，而sasl是一种认证方式，我们想办法来绕过sasl认证。避免等待，来提高效率。

在项目代码中加入System.setProperty("zookeeper.sasl.client", "false");，如果是Spring Boot项目可以在application.properties中加入zookeeper.sasl.client=false。

参考： Increased CPU usage by unnecessary SASL checks 。

如果更换canal.client.jar中依赖的zookeeper.jar的版本

把Canal的官方源码下载到本机git clone https://github.com/alibaba/canal.git ，然后修改client模块下pom.xml文件中关于ZooKeeper的内容，然后重新mvn install：

把自己项目依赖的包替换为刚刚mvn install生产的包：

关于选型的取舍

总结

以上所述是小编给大家介绍的基于Docker结合Canal实现MySQL实时增量数据传输功能,希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持！
如果你觉得本文对你有帮助，欢迎转载，烦请注明出处，谢谢！

标签：西藏潍坊怒江淮北东营西宁攀枝花香港

巨人网络通讯声明：本文标题《基于Docker结合Canal实现MySQL实时增量数据传输功能》，本文关键词基于,Docker,结合,Canal,实现,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

下面列出与本文章《基于Docker结合Canal实现MySQL实时增量数据传输功能》相关的同类信息！

基于Docker结合Canal实现MySQL实时增量数据传输功能

Canal的介绍 Canal的历史由来在早期的时候，阿里巴巴公司因为杭州和美国两个地方的机房都部署了数据库实例，但因为跨机房同步数据的业务需求，便孕育而生出了Canal，主要是基于...

10-16

巨人科技不得不说的三个特点

巨人科技成立于2007年，在不到十年的时间里几乎占领了ZG的整个市场。其发展速度与效率是极其高的，几乎就在十年的时间里...

05-16

语音电话机器人哪家好用（语音电话机器人哪家好用啊）

本篇文章给咱们谈谈语音电话机器人哪家好用，以及语音电话机器人哪家好用啊对应的知识点，期望对各位有所协助，不要忘...

05-18

南京鼓楼区：瞄上高端服务外包

鼓楼区是国家级服务外包示范区，作为南京国际服务外包产业园向转变增长方式要空间鼓楼区地方小，经济发展起点较高，...

10-22

福建外呼系统购买（外呼系统价格相信南牛网络

本文目录一览：1、外呼体系装置需求哪些费用？2、外呼体系多少钱一套？怎样装置？3、福建有家叫电销客的外呼体系，好用...

11-29

400电话怎么申办（400电话怎么申请办理）

400电话怎么申办（400电话怎么申请办理） 400电话是企业客服的一大利器，但是很多企业并不清楚如何申办。其实，申办400电...

08-14

品牌的服务性

客观地说:企业的品牌产品一经投放市场,便会给消费者提供不同种类用途形态、功能的不同层次的服务。以往企业经营观念认...

10-23

厦门蓝猫电销卡专卖

厦门蓝猫电销卡办理，找恒升通讯，主页有恒升通讯联系方式，厦门蓝猫电销卡白名单电话卡防封电销卡高频稳定高频不...

12-11

10-30

400电话怎么样开通？

如果您的企业想要提供更好的客户服务，增加客户满意度和保留度，那么您需要考虑开通400电话服务。我们将在本文中讲述如...

07-21

电话外呼系统怎么解决（电话外呼系统违法吗）

本文目次一览： 1、德律风外呼本领？？？ 2、电销企业为什么需要德律风外呼体系？该如何去遴选？ 3、外呼体系德律风挂断...

11-25

Altice突然关闭其在帕克斯堡的Suddenlink呼叫中心

老秦夜译 CTI论坛(ctiforum.com)5月4日消息（编译/老秦）:在帕克思堡（Parkersburg）的呼叫中心将于今年夏天关闭，公司的一位官员...

10-19

嘉峪关长江电销卡（嘉峪关长江电销卡客服电话）

本文目录一览：1、广州哪些公司做电话卡渠道的多2、电信长江时代的卡和电信卡有什么区别3、长江时代卡欠费怎么注销账号...

07-10

电话营销系统哪个是最好的？我认为哪个标准？

电话营销系统哪个是最好的？我认为哪个标准？电话营销系统在营销推广中发挥着重要作用，称a 电话营销系统可以在促进营...

10-30

B2B网站的5种不同类型的参与内容

摘要最后修改：2020年7月22日阅读时间：内容营销已经存在了很多年，随着技术的进步，公司在网上发布的内容也是如此。您...

12-14

Win10 Mobile预览版14322上手视频评测

今天微软向快速通道Insider会员推送了Win10 Mobile预览版14322，不仅带来大量新功能，而且修复了海量的bug，已知问题也明显比以...

10-20

电话机器人哪家好用吗（智能电话机器人哪家好

本文目录一览：1、智能电销机器人哪个好？2、哪家的ai智能电话销售机器人比较好？3、选择智能电销机器人的话，哪家的...

11-29

浙江智能外呼系统排名（浙江智能外呼系统排名第一）

本篇文章给咱们谈谈浙江智能外呼体系排名，以及浙江智能外呼体系排名榜首对应的知识点，期望对各位有所协助，不要忘了...

05-17

服务外包，责任不能外包（快评）

公共文化服务质量上不去？群众不买账？无锡新区将文化场馆的运行和服务整体外包的做法，效果不错：服务接地气了，人气...

10-22

配货中心的400电话方案怎么做?怎么做400电话办理才更省钱

分析配送中心的现状：改革开放和市场经济实施后，这种情况发生了根本性的变化。由于强调效率和快节奏，传统的运输方...

01-12

XP系统提示videoshot.exe应用程序错误的解决方法图文教程

XP系统提示videoshot.exe应用程序错误怎么办？迅雷有很多插件，其中的一个插件有时候会导致videoshot.exe应用程序出现错误，这...

10-19

400电话办理怎样更为方便?有什么样的办理流程呢湖南400电话办理需要多少费用

在申请400电话时，他们都希望有一个良好的便利，这需要注意方法。如果他们直接向移动、电信等运营商申请，通常会使他...

01-12

东莞外呼系统有效果吗（外呼系统好做吗）

今天给各位分享东莞外呼系统有效果吗的知识，其中也会对外呼系统好做吗进行解释，如果能碰巧解决你现在面临的问题，别...

05-16

彭氏国际化妆品集团客户服务呼叫中心上线运行

CTI论坛(ctiforum)12月23日消息（记者潘婷婷）：2010年8月，深圳市深海捷科技有限公司（以下简称“深海捷科技”）传来佳讯，...

10-19

电销机器人优势有哪些（电销智能机器人哪家公

本文目录一览：1、智能电销机器人的优势是什么？2、电话机器人的优势在哪里？3、电销机器人在电销范畴的技术优势是什...

11-29

Ubuntu 14.04 LTS 升级到Ubuntu 14.10的步骤

想知道怎样从Ubuntu 14.04 LTS 升级到Ubuntu 14.10么？这就是我们要讲的 Canonical不会强迫14.04的用户升级到14.10这个中间版本但这并...

10-20

重庆联通电话呼叫软件供应商,电话销售系统-信誉保证

重庆联通电话呼叫软件供应商,电话销售系统对企业来说，人工坐席的增加就是成本的增加，这也是电话销售行业的痛点问题...

12-17

中兴侯为贵回应美国安全调查报告很快能扭转业

离美国国会发布报告称华为和中兴对美国国家安全构成威胁，禁止这两家中国公司收购美国企业、参与关键基础设施建设的消...

01-16

印度软件外包巨头在苏州设交付中心

中新浙江网10月10日电(记者李飞云)今天，印度软件外包巨头沛特尼(patni)电脑系统选择在金秋落户中国苏州科技城，并将中国...

10-22

眉山电销专用电销卡（四川眉山电信号段）

本文目录一览：1、智慧加油站系统公司找哪家比较好？2、电销卡是什么?为什么电销卡也会封号?3、电销卡是什么智慧加油站...

07-10

女性福利，智能试装镜备受青睐

女性朋友们都爱逛街，网络商务的发展给人们带来了便利，但同时也少了一些逛街体验的真实乐趣;女性闺蜜们聚会的时候，...

10-13

厦门电销机器人哪家好一点（厦门机器人）

本篇文章给大家谈谈厦门电销机器人哪家好一点，以及厦门机器人对应的知识点，希望对各位有所帮助，不要忘了收藏本站...

05-17

400电话套餐费用400电话的市场应用情况是怎么样的？

最重要的是根据企业的需要选择400电话套餐。建议根据企业的通讯量选择套餐，避免浪费电话费用，节约企业成本。 1.行业...

01-13

400电话的申请方法详解

现在越来越多的企业开始使用400电话服务，这种电话号码对于客户来说更加方便，同时也能提高企业的形象和信誉。那么，要...

07-21

惠州语音电话机器人培训（惠州语音电话机器人培训班）

本篇文章给大家谈谈惠州语音电话机器人培训，以及惠州语音电话机器人培训班对应的知识点，希望对各位有所帮助，不要忘...

05-17

珠海语音线路板厂家（2019珠海线路板厂招聘信息）

今日给各位共享珠海语音线路板厂家的常识，其间也会对2019珠海线路板厂招聘信息进行解说，假如能可巧处理你现在面对的...

05-17

凉山火灾引入深思！巧用物联网卡何至于此

相信这几天都或多或少听到了关于凉山火灾的一些新闻报道吧!据我了解，截止至4月1日，在凉山参与救火失联的30名救火队员...

10-13

手机百度地图怎样添加商铺入驻？百度手机地图商铺添加电话入驻

商铺入驻百度地图收费标准？百度地图是免费的，你使用百度地图产生的流量是运营商收钱的。。。我用的高德导航很好用...

11-26

哪里可以办理400电话？办理400电话的方法有哪些？总结以下四个方面，让您轻松搞定！-哪里可

哪里可以办理400电话？办理400电话的方法有哪些？总结以下四个方面，让您轻松搞定！-哪里可以办理400 一、电信运营商官网...

08-14

财税公司怎么找客户？获客秘诀在哪里？

随着财税自动化的推广和普及，传统财税公司竞争越来越激烈，获客难，流失快，获客成本也居高不下。其实财税公司获客渠...

01-14

电销封号有什么解决方法?

电话销售封号主要是高频外呼和被客户投诉导致的，知道了原因就能有解决方法，下面小编就来给大家详细说说，电销封号有...

02-02

物联卡怎么查余额？这几个方法你知道吗？（物联卡怎么查询余额）

物联网发展至今，已被大部分人所熟知，物联卡也被引用到各行业领域的硬件设备当中。物联卡在应用的过程中多少会出现问...

11-07

海北呼叫中心系统电话经营销售系统

汇港通科技组装于2018年，是一家潜心于大中小企业精准经营销售和企业管理效劳处置计划的供给商。汇港通自决研制鉴于大...

10-31

钦州全自动外呼系统供应商（广西钦州钦机销售电话）

今天给各位分享钦州全自动外呼系统供应商的知识，其中也会对广西钦州钦机销售电话进行解释，如果能碰巧解决你现在面临...

03-02

临汾财税外呼系统价格,群呼系统-[信誉保证]

临汾财税外呼系统价格,群呼系统直到有了电销机器人之后，企业只需要一个电话系统就可以完成人工销售的80%的工作量。由...

12-17

励销云电销系统官网（励销云创始人）

本文目录一览： 1、励销云电销录音怎样翻开2、励销云打电话体系顶用人工打电话吗3、腾讯励销云作用怎样样4、励销云登入...

04-22

用手机打400电话收费吗镇江400电话资费标准

目前，400电话的普及让越来越多的企业加入了处理的行列，企业关心的是成本。 400电话是主要的分摊支付业务，手机拨打4...

01-13

深圳防封号防封号线路公司-[放心省心]

深圳防封号防封号线路公司强数据沉淀、工作协同，提升销售业绩与企业价值。高效完成业务电销系统能够帮助企业规范工作...

01-15

如何弄一个400电话号码

如何弄一个400电话号码呢?400电话大部分应用企业，个人是不可以办理400号码的，目前办理一个400号码倒是比较简单的，只是...

05-09

400电话众望所需400电话外呼

(400电话众望所需)(400电话外呼)以下内容由巨人小编整理发布。首先一定要是一个正规的企业，假如只是个人是无法办理的。...

01-11

申请400座机电话-申请400座机电话的步骤及注意事项

申请400座机电话-申请400座机电话的步骤及注意事项现在越来越多的公司和个人习惯使用400座机电话，这也就需要进行400电话...

08-14

基于Docker结合Canal实现MySQL实时增量数据传输功能

10-16

本页收集关于基于Docker结合Canal实现MySQL实时增量数据传输功能的相关信息资讯供网民参考！

推荐文章

上一篇：Windows7下Linux双操作系统安装图文教程

下一篇：linux环境下卸载oracle 11g的过程

一起分享吧