Flink CDC 与 Kafka 集成：Snapshot 还是 Changelog？Upsert Kafka 还是 Kafka？

互联网 1 年前 0 3

本文介绍: 我们知道，尽管 Flink CDC 可以越过 Kafka，将关系型数据库中的数据表直接“映射”成数据湖上的一张表（例如 Hudi 等），但从整体架构上考虑，维护一个 Kafka 集群作为数据接入的统一管道是非常必要的，这会带来很多收益。在 Flink CDC 之前，以 Debezium + Kafka Connect 为代表的技术组合都是将数据库的CDC数据先接入到 Kafka 中，然后再由后续的组件解析和处理。

我们知道，尽管 Flink CDC 可以越过 Kafka，将关系型数据库中的数据表直接“映射”成数据湖上的一张表（例如 Hudi 等），但从整体架构上考虑，维护一个 Kafka 集群作为数据接入的统一管道是非常必要的，这会带来很多收益。

在 Flink CDC 之前，以 Debezium + Kafka Connect 为代表的技术组合都是将数据库的CDC数据先接入到 Kafka 中，然后再由后续的组件解析和处理。引入 Flink CDC 后，我们同样可以沿用这种架构，对于 Flink CDC 来说，这只不过是将原来某

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

cdc flink kafka

相关文章

如何为Kafka加上账号密码（一）

如何为Kafka加上账号密码（一）

互联网 1 年前 6

涤生大数据实战：基于Flink+ODPS历史累计计算项目分析与优化（上）

涤生大数据实战：基于Flink+ODPS历史累计计算项目分析与优化（上）

大数据 1 年前 5

【flink状态管理（四）】MemoryStateBackend的实现

【flink状态管理（四）】MemoryStateBackend的实现

互联网 1 年前 6

Flink实战六_直播礼物统计

Flink实战六_直播礼物统计

互联网 1 年前 15

从Kafka系统中读取消息数据——消费

从Kafka系统中读取消息数据——消费

互联网 1 年前 4

「Kafka」消费者篇

互联网 1 年前 6

JVM之GC垃圾回收

互联网 1 年前 5

行为型设计模式—中介者模式

互联网 1 年前 6

发表回复取消回复