IT 용어정리(2)
-
Discrete Data
DATA(데이터)는 크게 Qualitative(정성적)데이터와 Quantitative(정량적) 데이터로 구분된다. '오늘 날씨의 온도는 -5도입니다.' 위의 같이 어떤 서술되어 의미로 표시되는 것은 정성적 데이터라 할 수 있고, 정량적 데이터는 -5와 같이 숫자로 표시되는 것을 의미한다.(간단하게 구분하면 숫자인 데이터와 숫자가 아닌 데이터.)Quantitaive(정량적)데이터는 Discrete(이산) 데이터와 Continous(연속형) 데이터로 구분할 수 있다. Discrete는 어떤 것을 세어서 나오(Counted)되어 만들어진 데이터를 이산형 데이터라 하며, 날씨, 온도, 길이와 같이 측정되어 만들어진 수치는 Continous(연속형) 자료로 말할 수 있다.
2014.04.25 -
Hadoop Distributed FileSystem(HDFS)
하둡 분산 파일 시스템(HDFS, Hadoop distributed file system)은 하둡 프레임워크를 위해 자바 언어로 작성된 분산 확장 파일 시스템이다. 따라서 자바가 지원되는 곳에서 실행이 가능하다. HDFS의 구조는 다음과 같다. ### HDFS 시스템의 특징가. HDFS의 시스템은 처리되는 일반적인 파일 크기가 커서 많은 거대한 파일을 잘 처리. 나. 한번만 쓰고 여러번 읽는다.다. random access가 아니기에 빠르게 Access가 가능하다.라. 결함의 탐지가 빠르고 복구가 빠름.(높은 신뢰성 보장) A. 여러기계에 대용량 파일들을 나눠서 저장, B. 데이터들을 여러 서버에 중복 저장마. 'Blocks'단위로 파일을 저장한다. (Block 기본 Size - 64MB) ### HDF..
2014.04.25