본문 바로가기

BigData

하둡 실행 및 동작 확인

by 성장하는 Sap린이 2020. 9. 24.

하둡 실행 및 동작 확인

start-all.sh : 모든 하둡 클러스터의 HDFS 시작, YARN 데몬 실행

hadoop namenode -format : 처음 실행 시에 한번만 마스터에서 네임노드를 포맷

hdfs version : 하둡 버전 확인
jps : 프로세스 확인

클러스터 동작 확인, 네임노드 웹

하둡 실행 테스트

Root 디렉터리 밑에꺼를 보여준다
파일 시스템은 하둡 분산파일 시스템

input 디렉터리를 만든다

hadoop fs -put /home/bigdata/hadoop-2.7.7/README.txt /input : 로컬파일시스템의 README.txt을 하둡 파일 시스템 input 디렉터리로 copy

하둡 실행 테스트 - wordcount

README.txt 파일의 단어 개수들을 세는 프로그램
결과는 output이라는 분산파일시스템에 들어가있다.

YARN 자원관리자 확인

앞의 wordcount 맵리듀스 프로그램을 임의의 데이터에 의해 실행

NOTICE.txt 파일을 분산파일시스템인 output 폴더에 wordcount 결과값을 저장

앞의 wordcount 맵리듀스 프로그램을 임의의 데이터에 대해 실행

'BigData' 카테고리의 다른 글

데이터세트 연산 (0)	2020.09.24
데이터세트 생성, 제플린노트북 (0)	2020.09.24
아파치 스파크 (0)	2020.09.24
하둡에서 datenode가 실행되지 않는경우 (0)	2020.09.24
리눅스 명령어, putty, notepad++ (0)	2020.09.24

공지사항

최근글

인기글

최근댓글

태그

전체 방문자

Today :

Yesterday :

티스토리툴바