HBase Region分裂与预分区

Question

请解释HBase的Region分裂机制，以及为什么需要预分区？如何进行预分区？。大数据 面试题。腾讯 面试题

小字辈 · Accepted Answer

Region分裂（Region Split）： 分裂触发条件： 当一个Region的大小超过hbase.hregion.max.filesize（默认10GB） 或Region的MemStore flush后总大小超过阈值 分裂策略（HBase 2.x）： SteppingSplitPolicy： 默认策略，分裂点位于Region的中间RowKey IncreasingToUpperBoundRegionSplitPolicy： 考虑Region数动态调整分裂阈值 KeyPrefixRegionSplitPolicy： 按前缀分组分裂（确保数据完整） DelimitedKeyPrefixRegionSplitPolicy： 按分隔符分组 分裂过程： RegionServer在ZooKeeper创建/region-in-transition节点 父Region下线（拒绝读写请求） 创建两个子Region（daughterA、daughterB） 父Region的HFile按分裂点拆分为两个HFile 子Region上线，父Region被清理 更新.META.表 为什么要预分区： 默认只...

HBase Region分裂与预分区

回答

小字辈