Spark on Kubernetes部署与资源管理

Question

请介绍Spark on Kubernetes的部署架构、资源管理方式以及与YARN模式的对比。。大数据 面试题。字节跳动 面试题

孤独的心 · Accepted Answer

Spark on K8s：Spark 2.3+支持原生Kubernetes调度，取代传统的YARN/Mesos。 一、架构： Kubernetes API Server │ ┌─────────┴─────────┐ │ Driver Pod │ │ Spark Driver │ └─────────┬─────────┘ │ ┌─────────┴─────────┐ │ Executor Pods │ │ Executor 1..N │ └───────────────────┘ 二、部署模式： 1. Cluster模式（推荐）： ./bin/spark-submit \ --master k8s://https://<k8s-apiserver>:6443 \ --deploy-mode cluster \ --conf spark.kubernetes.container.image=spark:3.4 \ --conf spark.kubernetes.nameset=spark-jobs \ --conf spark.kubernetes.driver.lim...

资源	K8s方式
CPU	`spark.kubernetes.{driver\|executor}.{request\|limit}.cores`
内存	`spark.{driver\|executor}.memory` + `spark.{driver\|executor}.memoryOverhead`
GPU	`spark.kubernetes.executor.limit.cores=gpu`
存储	PVC（持久卷声明）或emptyDir
动态扩展	Cluster Autoscaler自动扩缩Node

Spark on Kubernetes部署与资源管理

回答

孤独的心