Flink on YARN提交流程如下:首先,用户需要将Flink应用程序打包成jar包并上传到HDFS上。
专注于为中小企业提供网站设计、做网站服务,电脑端+手机端+微信端的三站合一,更高效的管理,为中小企业三都免费做网站提供优质的服务。我们立足成都,凝聚了一批互联网行业人才,有力地推动了超过千家企业的稳健成长,帮助中小企业通过网站建设实现规模扩充和转变。
然后,在YARN上创建一个应用程序并指定相应的参数,如资源、应用程序类型和jar包路径等。
YARN会在集群上启动相应数量的容器来运行Flink应用程序。Flink会通过ResourceManager获取容器的信息,并在每个容器上启动TaskManager进程。
最后,TaskManager会加载应用程序并执行任务。在任务完成后,YARN会自动关闭相应的容器。
本地模式
Spark单机运行,一般用于开发测试。
Standalone模式
构建一个由Master+Slave构成的Spark集群,Spark运行在集群中。
Spark on Yarn模式
Spark客户端直接连接Yarn。不需要额外构建Spark集群。
Spark on Mesos模式
Yarn有三种调度策略配置参数,分别是FIFO、Capacity和Fair。FIFO是最简单的策略,按照作业提交的顺序进行调度。
Capacity策略根据集群资源的容量进行分配,可以为不同的队列设置不同的资源容量。
Fair策略根据作业的需求和历史资源使用情况进行动态调度,以实现公平共享资源的目标。这些策略可以根据集群的需求进行配置,以满足不同的调度需求。
在YARN中,有三种常见的调度策略,分别是:
基于资源分配的调度策略:
yarn.scheduler.minimum-allocation-mb:表示每个任务的最小内存大小。
yarn.scheduler.maximum-allocation-mb:表示每个任务的最大内存大小。
yarn.scheduler.minimum-allocation-vcores:表示每个任务的最小CPU核数。
yarn.scheduler.maximum-allocation-vcores:表示每个任务的最大CPU核数。
基于任务优先级的调度策略:
yarn.scheduler.minimum-allocation-mb:表示每个任务的最小内存大小。
到此,以上就是小编对于linux如何启动的问题就介绍到这了,希望这3点解答对大家有用。
当前标题:linux中怎么启动yarn集群
文章源于:http://www.csdahua.cn/qtweb/news15/268915.html
网站建设、网络推广公司-快上网,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 快上网