썸네일 🐘 하둡 기초 정리 하둡에 대해 알아보기 전! 우리는 기본적인 배경에 대해 알아야 한다. 하둡은 기본적으로 빅데이터를 처리하는 과정 속에서 사용된다. 빅데이터를 처리하는 흐름으로는 우선 데이터를 수집후에, 저장하고 처리한다. 그 결과를 바탕으로 분석하고 결과를 표현하게 된다. 이러한 단계 중에 빅데이터를 어떻게 저장~처리~하는지에 대한 부분을 담당하는 역할이 바로 하둡이다. 하둡은 뭐하는 친구일까? 🤔 Hadoop의 약자를 살펴보자 High-Availability Distributed Object-Oriented Platform 인데.. 오우 너무 길다 ㅎ 차근 차근 살펴보자 우선 High-Availability : 고-가용성 Distributed : 분산된, 광범위한 Object-Oriented : 객체 지향형 Platf..
썸네일 하둡 & 하둡 에코시스템 나는 전부터 아파치 하둡.. 이름은 그렇다 치고 왜 로고를 코끼리로 했을까? 라는 의문점이 많았다. 오늘 한번 검색해보니 놀랍게도 이유는 모르겠지만 수많은 동물중 코끼리는 빅데이터를 상징하는 동물이라고 한다. 이유는.. 나도 잘 모르겠다. 그리고 아파치 하둡의 이름은 더그 커팅의 아들이 갖고 놀던 노란색 코끼리 인형의 이름으로 지었다고 한다.. 로고또한 아이가 가지고 놀던 인형 그대로를 표현한 것이라고 한다. 이름의 뜻이 엄청 거창할줄 알았지만 이름의 의미가 생각보다 친근해서 놀랐다. 🐘 아파치 하둡이란 ? 빅데이터를 수집, 저장, 처리, 분석 할 수 있는 소프트웨어 프레임워크이다. Apache Hadoop의 특징 Distributed: 수십만대의 컴퓨터에 자료 분산 저장 및 처리 Scalable: 용량..