ClickHouse ZooKeeper优化策略

Question

ClickHouse重度依赖ZooKeeper进行副本协调，在实际生产中ZK成为性能瓶颈。请详细说明ClickHouse对ZK的依赖场景、常见的ZK压力问题以及优化方案。如何减少ZK读写、优化ZK节点配置？。大数据 面试题。腾讯 面试题

古法程序员 · Accepted Answer

1. 依赖场景操作ZK读写频率 Part合并频繁读写持续 Insert提交写每次插入副本同步读写持续 Mutations写低频 DDL执行读写低频集群心跳读频繁 2. 常见问题 ZK Session超时：大量Part合并导致ZK请求积压写入延迟高：/clickhouse/task_queue 路径下节点数过多 Watch风暴：每个Part变化触发Watch通知 ZK磁盘IO高：事务日志（txnlog）持续写入 3. 优化方案减少ZK操作 -- 减少合并频率 SET merge_tree.max_bytes_to_merge_at_max_space_in_pool = 0; -- 禁用MergeTree的轻量级删除 SET allow_experimental_lightweight_delete = false; -- 增大INSERT块大小 SET min_insert_block_size_rows = 1_000_000; 配置优化

操作	ZK读写	频率
Part合并	频繁读写	持续
Insert提交	写	每次插入
副本同步	读写	持续
Mutations	写	低频
DDL执行	读写	低频
集群心跳	读	频繁

ClickHouse ZooKeeper优化策略

回答

古法程序员