HDFS의 기본 구조(HDFS Architecture)

Node: 컴퓨터 한 대라고 생각하면 됨.
Name Node, Data Node: HDFS 컨트롤
Job tracker, task tracker: MapReduce 컨트롤

티스토리 뷰

Posted by goudacheese on 2018. 4. 25. 12:27 in Programming/Data Engineering /

HDFS Architecture

HDFS와 MapReduce는 둘다 Master/Slave 구조

HDFS
- Master : Name node(메타정보관리)
- Slave : Data node(실제 데이터)
MapReduce
- Master : JobTracker(TaskTracker의 상태 및 전체 작업의 진행 상황등을 지속적으로 감시하며 일 시적인 장애에 대해 자동 복구 기능 제공)
- Slave : TaskTracker
- Map Task
  
  레코드 단위로 처리해야 하는 작업을 담당
- Reduce Task
  
  관련된 데이터 끼리 묶어서 처리해야 하는 작업 담당
MapReduce만 코딩. 나머지는 자동.

Hadoop wordCount example (0)	2018.04.25
[Hadoop] Hadoop 완전분산모드 설치 (0)	2018.04.14