1.系统架构
1.1 整体构成
1.2 作业管理器(JobManager)
控制一个应用程序执行的主进程,是Flink集群中任务管理和调度的核心
JobMaster
-
是JobManager中最核心的组件,负责处理单独的作业(Job)
-
在提交作业时,JobMaster会先接受到要执行的应用,一般是由客户端提交来的(包括Jar包,数据流图(dataflow graph),和作业图(Job Graph))
-
JobMaster会把JobGraph转换成一个物理层面的数据流图,这个图叫做“执行图”(Execution Graph),它柏寒了所有可以并发执行的任务。JobMaster会向资源管理器(Resource Manager)发出请求,申请执行任务必要的资源。一旦它获取到了足够的资源,就会将执行图分发到真正运行它们的TaskManager上。
-
在运行过程中,JobMaster会负责所有需要中央协调的操作,比如检查点(Checkpoints)的协调;
资源管理器(ResourceManager)
- ResourceManager主要负责资源的分配和管理。在Flink集群只有一个。所谓“资源”,主要是指TaskManager的任务槽(Task slots),任务槽就是Flink集群中的资源调配单元,包含了机器用来执计算的一组CPU和内存资源。每一个任务(Task)都需要分配到一个Slot上执行
分发器(Dispatcher)
- Dispatcher主要负责提供一个REST接口,用来提交应用,并且负责为每一个新提交的作业启动一个新的JobMaster组件。Dispatcher也会启动一个WebUI,用来方便的展示和监控作业的执行信息。Dispatcher在架构中并不是必须的,在不同的部署模式下可能会被忽略。
1.3 任务管理器(TaskManager)
- Flink中的工作进程。通常在Flink中会有多个TaskManager运行,每一个TaskManager都包含了一定数量的插槽(Slots).插槽的数量限制了TaskManager能够并行处理的任务数量。
- 启动之后,TaskManager会向资源管理器注册它的插槽;收到资源管理器的指令后,TaskManager就会将一个或者多个插槽提供给JobMaster调用。JobMaster就可以向插槽分配任务(tasks)来执行了。
- 在执行过程中,一个TaskManager可以跟其他运行同一应用程序的Task Manager交换数据