Kubernetes弹性伸缩在大数据场景的应用

Question

K8s弹性伸缩是大数据云原生的核心能力。请介绍K8s在大数据场景下的三种弹性伸缩策略：1）HPA（Pod级水平伸缩）；2）VPA（垂直伸缩）；3）Cluster Autoscaler（节点级伸缩）。如何将这些策略应用到Spark/Flink作业中？如何解决Spark Shuffle在Pod伸缩时的数据丢失问题？。大数...

编译有声 · Accepted Answer

K8s弹性伸缩实践 三种伸缩策略： HPA（Horizontal Pod Autoscaler） 基于CPU/Memory/自定义指标（如Kafka LAG）自动扩缩Pod 适用于Flink TaskManager、Kafka Connect VPA（Vertical Pod Autoscaler） 自动调整Pod的CPU/Memory Request/Limit 适用于Spark Driver、Flink JobManager Cluster Autoscaler 当Pod因资源不足Pending时，自动扩容K8s节点 配合Spot实例节省成本 Spark/Flink应用： Spark on K8s： spark.dynamicAllocation.enabled=true 动态申请Executor Shuffle数据写远程存储（如RSS Remote Shuffle Service）避免Pod销毁丢失 Flink on K8s： kubernetes.operator.job.autoscaler.enabled Flink Operator自动调整并行度 TaskManager...

Kubernetes弹性伸缩在大数据场景的应用

回答

编译有声