'빅데이터'가 이슈가 됨에 따라 No SQL, MapReduce 등등 많은 말들이 나돌기 시작했다.
그중 '하둡(Hadoop)'은 NoSQL DB의 일종일것이라 생각했는데 그게 아니었다.
Cassandra, HBase, Redis등이 DB의 일종들이고 하둡은 그저....
"MapReduce의 오픈소스버전."
"대용량 데이터를 처리하는 분산 응용 프로그램을 작성하고 실행시키기 위한
오픈 소스 프레임워크"
첫번째 줄이 훨씬 쉽죠? ㅋㅋ
공식 페이지(http://hadoop.apache.org)에서는 다음과 같이 말합니다.
The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using simple programming models.
'아파치 하둡 소프트웨어 라이브러리'는... 프레임워크입니다. 큰데이터 셋들의 분산처리를 위한....
단순 프로그래밍 모델들을 사용한 컴퓨터들의 클러스터... (across는 어떻게 해석하고 이어붙여야하나요;;;쿨럭)
다음번엔 맵리듀스(MapReduce)가 무엇인지 알아보죠 ㅋ