ES高可用架构涉及常用功能整理

本文介绍: 探讨es的系统架构以及以及整体常用的命令和系统分析，本文主要探讨高可用版本的es集群，并基于日常工作中的沉淀进行思考和整理。更多关于分布式系统的架构思考请参考文档[关于常见分布式组件高可用设计原理的理解和思考](https://blog.csDN.net/weixin_43845924/article/details/135713107)

探讨es的系统架构以及以及整体常用的命令和系统分析，本文主要探讨高可用版本的es集群，并基于日常工作中的沉淀进行思考和整理。更多关于分布式系统的架构思考请参考文档关于常见分布式组件高可用设计原理的理解和思考

es面对的使用场景是，大量数据的生产和消费，是面对大数据的消息中间件。这么巨大的业务体量，难以通过一台机器完成所有的数据写入、存储和请求，因此需要进行数据的分片，采用 分片模式 进行数据拆分，从而降低单台机器的压力，并能够提供大量的集群扩展能力。

按照 分片模式 的架构模式，在架构上需要拆分2种类型的角色

在es的系统架构中，全局视角 并没有拆分出一个单独的组件进行完成，而是复用es进程，通过es节点内部进行选主选择出Master主节点，负责全局的元数据存储和数据视角，将负责管理集群范围内的所有变更，例如增加、删除索引，或者增加、删除节点等，维护分片在节点间的分配关系
在这里插入图片描述
相关核心的组件和角色作用如下

组件	部署模式	组件作用	备注
Master	多节点部署	存储集群的元数据，具体集群数据的全局视角	主要职责是和集群操作相关的内容，例如创建或删除索引、跟踪哪些节点是集群的一部分，并决定哪些分片分配给相关的节点。通过Raft协议选主
Data	多节点部署	它负责接收、存储和管理数据	接收和存储消息数据，接收来自客户端写入的数据，并将这些消息存储在自己的磁盘上。数据节点也区分多种角色，比如热节点、冷节点等
Ingest	多节点部署	执行由预处理管道组成的预处理任务	将数据进行清洗、集成、转换等预处理，从而提升数据的查询性能

elasticsearch.yml

path.data: /data1/1687270572000005409/es/data
# # 尽可能按照标签打散，但是如果机器不满足标签要求，也不强制打散，可以配置多个，如rack,ip
cluster.routing.allocation.awareness.attributes: ip
# node的自定义属性，从而给机器打上标签，通过标签将索引、分片打散在不同的机器上
node.attr.ip: xx
node.attr.rack: rack_1
node.attr.temperature: hot
# 默认发现的master节点列表，如果空集群会通过这个配置发现其他的master节点并通信，完成选主
discovery.zen.ping.unicast.hosts: ["xx.xx.xx.xx:9300", "xx.xx.xx.xx:9300", "xx.xx.xx.xx:9300"]
# 设置在选举 Master 节点时需要参与的最少的候选主节点数，默认为 1。
# 如果使用默认值，则当网络不稳定时有可能会出现脑裂。合理的数值为(n/2)+1
discovery.zen.minimum_master_nodes: 2

# 限流器配置，默认30%，通常调整到90%
indices.breaker.total.limit: 90%
indices.memory.index_buffer_size: 15%
indices.queries.cache.count: 500
indices.breaker.fielddata.limit: 20%
indices.breaker.request.limit: 6%
indices.fielddata.cache.size: 15%
indices.queries.cache.size: 5%

# 集群角色配置
node.master: true
node.ingest: true
node.data: true
node.name: 1687270572000005409
# 感知当前节点的磁盘使用率水位
cluster.routing.allocation.disk.watermark.low: 85%
cluster.routing.allocation.disk.watermark.high: 90%
cluster.routing.allocation.disk.watermark.flood_stage: 95%
# 网络配置
network.host: 0.0.0.0
network.publish_host: xx.xx.xx.xx
transport.tcp.port: 9300
http.port: 9200
# 写入线程池的长度，提升写入性能
thread_pool.write.queue_size: 10000
thread_pool.write.queue_size: 10000
thread_pool.search.queue_size: 500

# 提升集群恢复分片的并发度和带宽
cluster.routing.allocation.cluster_concurrent_rebalance: 50
cluster.routing.allocation.node_concurrent_recoveries: 50
cluster.routing.allocation.node_initial_primaries_recoveries: 50
indices.recovery.max_bytes_per_sec: 400mb


# 关闭系统调用过滤器
bootstrap.system_call_filter: false

# 通过集群名称标识、加入集群
cluster.name: "xx"

# node的自定义属性，从而给机器打上标签，通过标签将索引、分片打散在不同的机器上
cluster.routing.allocation.awareness.attributes: ip
node.attr.ip: xx

# node的自定义属性，从而给机器打上标签，通过标签将索引、分片打散在不同的机器上
cluster.routing.allocation.awareness.attributes: rack,ip
node.attr.ip: xx
node.attr.rack: rack1

# node的自定义属性，从而给机器打上标签，通过标签将索引、分片打散在不同的机器上
cluster.routing.allocation.awareness.attributes: rack
node.attr.rack: rack1
# 强制要求按照rack1、rack2分配打散
cluster.routing.allocation.awareness.force.rack.values: rack1,rack2

# 写入线程池的长度，提升写入性能
thread_pool.write.queue_size: 10000
thread_pool.write.queue_size: 10000
thread_pool.search.queue_size: 500

curl -XPUT 'http://127.0.0.1:9200/_cluster/settings'   -H 'Content-Type: application/json' -d '{
  "persistent": {
    "thread_pool.write.queue_size": 10000,
    "thread_pool.write.queue_size": 10000,
    "thread_pool.search.queue_size": 500
  }
}'

# 提升集群恢复分片的并发度和带宽，默认配置是2
cluster.routing.allocation.cluster_concurrent_rebalance: 50
cluster.routing.allocation.node_concurrent_recoveries: 50
cluster.routing.allocation.node_initial_primaries_recoveries: 50
indices.recovery.max_bytes_per_sec: 400mb

curl -XPUT 'http://127.0.0.1:9200/_cluster/settings'   -H 'Content-Type: application/json' -d '{
  "persistent": {
    "cluster.routing.allocation.cluster_concurrent_rebalance": "50",
    "cluster.routing.allocation.node_concurrent_recoveries": "50",
    "cluster.routing.allocation.node_initial_primaries_recoveries": "50",
    "indices.recovery.max_bytes_per_sec": "100mb"
  }
}'

indices.breaker.total.limit: 90%

curl -XPUT 'http://127.0.0.1:9200/_cluster/settings'   -H 'Content-Type: application/json' -d '{
  "persistent": {
    "indices.breaker.total.limit": "90%"
  }
}'

操作	说明
create	创建文档
delete	删除文档，ES对文档的删除是懒删除机制，即标记删除
index	这里的index是动词，表示创建索引
update	文档更新

index.translog.flush_threshold_ops: 执行多少次操作后执行一次flush，生成新的commit，默认无限制
index.translog.flush_threshold_size: translog一旦达到最大大小，就会发生flush， (生成commit文件，并删除commit事务前的translog)，默认为512mb

curl -XPUT -H "Content-Type: application/json" http://localhost:9200/$index/_settings -d '{
    "refresh_interval": "1s"
}'

# node的自定义属性，从而给机器打上标签，通过标签将索引、分片打散在不同的机器上
cluster.routing.allocation.awareness.attributes: ip
node.attr.ip: xx

# node的自定义属性，从而给机器打上标签，通过标签将索引、分片打散在不同的机器上
cluster.routing.allocation.awareness.attributes: rack
node.attr.rack: rack1
# 强制要求按照rack1、rack2分配打散
cluster.routing.allocation.awareness.force.rack.values: rack1,rack2

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

es 分片

ES高可用架构涉及常用功能整理

1. es的高可用系统架构和相关组件

2. es的核心参数

2.1 常规配置

2.2 特殊优化配置

2.2.1 数据分片按ip打散

2.2.2 数据分片机架感知

2.2.3 强制要求数据分片机架感知

2.2.4 写入线程池优化

2.2.5 分片balance优化

2.2.6 限流控制器优化

3. es常用命令

3.1 常用基础命令

3.2 常用运维命令

4. 事务性

4.1 数据写流程

4.1.1 4种类型写操作

4.1.2 正常写入流程

4.2 数据持久化过程

4.2.1 相关概念

4.2.1.1 translog文件

4.2.1.2 segment文件

4.2.1.3 translog和segment的差异

4.2.1.4 flush

4.2.1.5 refresh

4.2.1.6 fsync

4.2.2 持久化流程

4.3 数据读流程

5. 日志复制流程

5.1. segment文件解析

5.2. es的日志复制流程

5.3. es的日志清理机制

5.3.1 segment合并

5.3.2 translong清理

6. 疑问和思考

6.1 es的flush过程和linux的cache刷盘有什么区别和联系？

6.2 配置按照ip打散

6.3 配置机架感知的参考配置

7. 参考文档

发表回复取消回复

ES高可用架构涉及常用功能整理

1. es的高可用系统架构和相关组件

2. es的核心参数

2.1 常规配置

2.2 特殊优化配置

2.2.1 数据分片按ip打散

2.2.2 数据分片机架感知

2.2.3 强制要求数据分片机架感知

2.2.4 写入线程池优化

2.2.5 分片balance优化

2.2.6 限流控制器优化

3. es常用命令

3.1 常用基础命令

3.2 常用运维命令

4. 事务性

4.1 数据写流程

4.1.1 4种类型写操作

4.1.2 正常写入流程

4.2 数据持久化过程

4.2.1 相关概念

4.2.1.1 translog文件

4.2.1.2 segment文件

4.2.1.3 translog和segment的差异

4.2.1.4 flush

4.2.1.5 refresh

4.2.1.6 fsync

4.2.2 持久化流程

4.3 数据读流程

5. 日志复制流程

5.1. segment文件解析

5.2. es的日志复制流程

5.3. es的日志清理机制

5.3.1 segment合并

5.3.2 translong清理

6. 疑问和思考

6.1 es的flush过程和linux的cache刷盘有什么区别和联系？

6.2 配置按照ip打散

6.3 配置机架感知的参考配置

7. 参考文档

相关文章

发表回复 取消回复

发表回复取消回复