본문 바로가기
BigData

하둡 실행 및 동작 확인

by 성장하는 Sap린이 2020. 9. 24.

하둡 실행 및 동작 확인

 

  • start-all.sh : 모든 하둡 클러스터의 HDFS 시작, YARN 데몬 실행

  • hadoop namenode -format : 처음 실행 시에 한번만 마스터에서 네임노드를 포맷

 

  • hdfs version : 하둡 버전 확인
  • jps : 프로세스 확인

 

클러스터 동작 확인, 네임노드 웹

 

 

 

하둡 실행 테스트

 

  • Root 디렉터리 밑에꺼를 보여준다
  • 파일 시스템은 하둡 분산파일 시스템

  • input 디렉터리를 만든다

  • hadoop fs -put /home/bigdata/hadoop-2.7.7/README.txt /input : 로컬파일시스템의 README.txt을 하둡 파일 시스템 input 디렉터리로 copy

 

하둡 실행 테스트 - wordcount

  • README.txt 파일의 단어 개수들을 세는 프로그램
  • 결과는 output이라는 분산파일시스템에 들어가있다.

 

YARN 자원관리자 확인

 

앞의 wordcount 맵리듀스 프로그램을 임의의 데이터에 의해 실행

 

  • NOTICE.txt 파일을 분산파일시스템인 output 폴더에 wordcount 결과값을 저장

 

앞의 wordcount 맵리듀스 프로그램을 임의의 데이터에 대해 실행

 

'BigData' 카테고리의 다른 글

데이터세트 연산  (0) 2020.09.24
데이터세트 생성, 제플린노트북  (0) 2020.09.24
아파치 스파크  (0) 2020.09.24
하둡에서 datenode가 실행되지 않는경우  (0) 2020.09.24
리눅스 명령어, putty, notepad++  (0) 2020.09.24