YARN(Yet Another Resource Negotiator) 이란?

  • A framework for job scheduling and cluster resource management.

YARN 핵심 구성 요소

  • Resource Manager(RM)

    • YARN 클러스터의 Master 서버로 하나 또는 이중화를 위해 두개의 서버에만 실행됨

    • 클러스터 전체의 리소스를 관리

    • YARN 클러스터의 리소스를 사용하고자 하는 다른 플랫롬으로부터 요청을 받아 리소스 할당(스케줄링)

  • Node Manager(NM)

    • YARN 클러스터의 Worker 서버로 Resource Manager를 제외한 모든 서버에 실행

    • 사용자가 요청한 프로그램을 실행하는 Container를 fork 시키고 Container를 모니터링

    • Container 장애 상황 또는 Container가 요청한 리소스보다 많이 사용하고 있는지 감시(요청한 리소스보다 많이 사용하면 해당 Container를 kill 시킴)

  • Application Master(AM)

    • RM과 협상하여 하둡 클러스터에서 자기가 담당하는 어플리케이션에 필요한 리소스를 할당.
    • NM과 협의하여 자기가 담당하는 어플리케이션을 실행하고 그 결과를 주기적으로 모니터
    • 자기가 담당하는 어플이케이션의 실행 현황을 주기적으로 RM에게 보고합니다.

DEV 시스템 구성

  • EPC VM 4 식 (CPU: 2 Core, Mem: 4GB, HDD: 80GB)

  • Hadoop 3.0 (2017-12-13 GA)

    • 주요 특징 : Erasure Coding in HDFS

  • 구현 알고리즘: k-means



'spark,kafka,hadoop ecosystems > apache.hadoop' 카테고리의 다른 글

hadoop 구성  (0) 2018.11.20
hadoop zipfile as input format  (0) 2018.11.20
hadoop - mapreduce  (0) 2018.11.20

+ Recent posts