Hadoop Distributed FileSystem(HDFS)
하둡 분산 파일 시스템(HDFS, Hadoop distributed file system)은 하둡 프레임워크를 위해 자바 언어로 작성된 분산 확장 파일 시스템이다. 따라서 자바가 지원되는 곳에서 실행이 가능하다. HDFS의 구조는 다음과 같다. ### HDFS 시스템의 특징가. HDFS의 시스템은 처리되는 일반적인 파일 크기가 커서 많은 거대한 파일을 잘 처리. 나. 한번만 쓰고 여러번 읽는다.다. random access가 아니기에 빠르게 Access가 가능하다.라. 결함의 탐지가 빠르고 복구가 빠름.(높은 신뢰성 보장) A. 여러기계에 대용량 파일들을 나눠서 저장, B. 데이터들을 여러 서버에 중복 저장마. 'Blocks'단위로 파일을 저장한다. (Block 기본 Size - 64MB) ### HDF..
2014.04.25