메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

실전 하둡 운용 가이드 : 대규모 하둡 클러스터 관리를 위한 필수 노하우

한빛미디어

번역서

절판

  • 저자 : 에릭 새머
  • 번역 : 장형석
  • 출간 : 2013-07-24
  • 페이지 : 344 쪽
  • ISBN : 9788968480300
  • 물류코드 :2030
  • 초급 초중급 중급 중고급 고급
4.5점 (2명)
좋아요 : 34

[어떤 독자를 위한 책인가?]

  • 하둡을 설치하고 운영하려는 시스템 엔지니어
  • 하둡 클러스터 관리자
  • 하둡을 체계적으로 다시 공부하고 싶은 개발자

 

이 책은 상용으로 하둡을 실행하는 방법을 알려주는 실전 가이드다. 하둡에 익숙한 사람들은 설치를 위한 대안을 이미 알고 있거나 또는 CPU 효율을 기준으로 맵 슬롯의 개수를 적절하게 조절하는 방법에 대해 다르게 생각할 수도 있다. 하지만 예상보다 더 좋을 것이다. 가능한 모든 시나리오들을 다 나열하는 것이 목적이 아니므로, 주요 배포판에서 검증된 작업을 주로 설명한다. 장별 내용은 다음과 같다.

  • 2장, 3장_ HDFS와 맵리듀스는 무엇이고, 왜 필요하고, 어떻게 동작하는지 심도 깊게 설명한다. 
  • 4장_ 하드웨어 선택, 기본 자원 계획, 운영체체 선택과 설정, 하둡 배포판과 버전 선택, 하둡 클러스터를 위한 네트워크 고려사항을 포함한 하둡 배포를 위한 계획의 전 과정을 다룬다. 
  • 5장_ 하둡을 직접 설치해서 테스트한다. 5장은 주제별로 구성되어 있으며 중요한 속성들의 목록을 포함한 설정과 설치 정보를 다룬다. 
  • 6장_ 강한 보안 요구사항이나 하둡의 식별, 접근, 인증에 대해 다룬다. 
  • 7장_ 다수의 그룹이 단일 대형 클러스터를 공유할 때 필요한 모든 것을 다룬다. 이 장은 서비스 수준 규약을 준수하면서 자원들을 적절하게 관리하고 할당하는 데 도움을 준다. 
  • 8장_ 모든 것이 준비되고 실행되고 나서 읽어야 할 가장 일반적인 조작과 작업을 위한 실행 설명서를 제공한다. 
  • 9장_ 하둡과 같은 복잡한 분산 시스템의 트러블슈팅 이론과 실습을 다루고 약간의 실전 사례도 포함하고 있다. 
  • 10장_ 문제를 줄이기 위해 하둡 클러스터의 효율적인 모니터링 방법을 다룬다. 
  • 11장_ 하둡의 백업과 돌이킬 수 없는 실패에 대처하는 기본 도구와 기술을 다룬다.
에릭 새머 저자

에릭 새머

클라우데라의 핵심 솔루션 아키텍처로 고객이 하둡 및 관련 대규모 프로젝트를 기획, 배포, 개발, 운영하는 데 도움을 주고 있다. 분산, 동시 처리, 데이터 수집 및 처리 시스템을 개발하고 운영했다. 오픈소스 커뮤니티에 참여하여 지난 10년간 다수의 프로젝트에 기여했다.

장형석 역자

장형석

충북대학교 비즈니스데이터융합학과 교수

1장 소개
_1.1 하둡 에코시스템 
_1.2 이 책에 대하여 

 

2장 하둡 분산 파일시스템
_2.1 목표와 동기 
_2.2 설계 
_2.3 데몬 
_2.4 데이터 읽기와 쓰기 
_2.5 파일시스템 메타데이터 관리 
_2.6 네임노드 고가용성 
_2.7 네임노드 페더레이션 
_2.8 접근과 통합 

 

3장 맵리듀스
_3.1 맵리듀스 4단계 처리 과정 
_3.2 하둡 맵리듀스 개요 
_3.3 얀 

 

4장 하둡 클러스터 계획 수립
_4.1 하둡 배포판과 버전 선택 
_4.2 하드웨어 선택 
_4.3 운영체제 선택과 준비 사항 
_4.4 커널 튜닝 
_4.5 디스크 설정 
_4.6 네트워크 설계 

 

5장 설치와 설정
_5.1 하둡 설치하기 
_5.2 설정 : 개요 
_5.3 환경 변수와 셸 스크립트 
_5.4 로그 설정 
_5.5 HDFS 
_5.6 네임노드 고가용성 
_5.7 네임노드 페더레이션 
_5.8 맵리듀스 
_5.9 랙 토폴로지 
_5.10 보안 

 

6장 식별, 인증, 허가
_6.1 식별 
_6.2 커버로스와 하둡 
_6.3 허가(권한 부여) 
_6.4 종합적으로 운용하기 

 

7장 자원 관리
_7.1 자원 관리란 무엇인가? 
_7.2 HDFS 쿼터 
_7.3 맵리듀스 스케줄러 

 

8장 클러스터 관리
_8.1 하둡 프로세스 관리 
_8.2 HDFS 관리 작업 
_8.3 맵리듀스 관리 작업 

 

9장 트러블슈팅
_9.1 감별 진단의 시스템 적용 
_9.2 일반적인 실패와 문제 
_9.3 컴퓨터 플러그인? 
_9.4 처방과 보살핌 
_9.5 전쟁 이야기 

 

10장 모니터링
_10.1 개요 
_10.2 하둡 메트릭 
_10.3 상태 모니터링 

 

11장 백업과 복원
_11.1 데이터 백업 
_11.2 네임노드 메타데이터

 

부록_사라진 설정 속성

빅데이터에 대한 이슈는 몇년전부터
거론되었던거 같다.
그와 더불어 하둡에 대한 책도 많이 나오는 듯 하다.

사실 개인적으로 개개인이 하둡을 사용할 일이 얼마나 많을까 싶긴 하다.
빅데이터 처리에 대한 부분의 필요성이 생긴다면
해당하는 아키텍쳐팀이 작업을 하지 개개인이 처리하진 않기때문이다.
[spring 프레임Ÿp이 많이 사용되긴 하지만 개발자가 직접 작업하는 경우는 거의없다.
해당 아키텍쳐팀이 spring 프레임Ÿp을 녹인 프레임Ÿp을 사용한다. ]
하지만 그래도 하둡에 대해서 알아두는건 당연히 좋을거라고 생각한다.

실제로 빅데이터 처리가 필요한 곳이 얼마나 많을까 하는 생각도 든다.
빅데이터 처리에 대해서 많은 얘기가 나오고 있지만
빅데이터 처리에 앞서 기존 데이터의 처리에 대한 좀더 효과적인 운영이나 개선이
우선이 되야 하지 않을까 하는 생각도 든다.
물론 지금은 정보화 시대라 앞으로 그러한 빅데이터에 대한 처리가 많이 필요할 것이다.

이 책은
하둡에 대한 기본개념에서 설치, 운영,관리에 대한 내용을 다루고 있는거 같다.
기본개념이나 설치과정보다는 설치후 운영관리에 대해서
주로 다루고 있는거 같다.

하둡을 전혀 모르는 사람이 기본적인 내용이나 하둡을 설치하려고 한다면
도움이 안 될 수도 있다.

하둡에 대해서 어느정도 알고 설치,운영 하려는 사람에게는
도움이 될 듯 하다.

하둡 관련해서 전문가라고 불리는 에릭 새머라는 사람이 쓴 책으로,

책의 난이도는 하둡을 전혀 모르는 생초보를 위한 타겟으로 만든 책이 아닌

어느정도 상용 수준으로 설치하고 운영하려는 시스템 엔지니어들을 위한 책이므로

하둡을 처음 접하시고자 하시는 분들이나, 개념이 하나도 없는 상태에서 보시려면 상당한 시간과 노력이

필요할 수 있습니다. 그러나 저도 하둡을 접한지 얼마 안되어 이책을 보는데 정말 도움이 되는 예제,개념설명들이

알차게 들어있고 특히 "우리나라 대부분 실전 예제 책처럼 주입식으로 예제보여주면서 이거 따라하면 다 된다"

가 아닌 왜 되는지, 원리가 무엇인지, 동작되는 개념이 무엇인지에 대한 설명이 주를 이르고 있는 책입니다.

쉽게말해서 대학 전공같은 책이라고 보면 될거같네요.

저에게는 정말 완벽한 책이 아닐 수 없습니다.

개념 자체를 이해하기 힘들었는데 이책을 통하여 여러모로 이해가 잘되고 좋았습니다.

그렇다고 예제가 부실하느냐? 그건 절대아닙니다.

위에서 말씀드렸지만 실전 운용자들을 위해 만들어진 책이기때문에 책 내용 전체가 실전에서 쓰일 소스들과 예제들로 가득 차있고 그 예제들에 대해 개념설명이 잘되있는 구조라고 보시면 되겠네요.

여튼 후회 안되실겁니다. 다만 완전 초보분들은 처음 접하기 조금 어려울 수도 있습니다. 이점 참고해주세요~

결제하기
• 문화비 소득공제 가능
• 배송료 : 2,000원배송료란?

배송료 안내

  • 20,000원 이상 구매시 도서 배송 무료
  • 브론즈, 실버, 골드회원이 주문하신 경우 무료배송

무료배송 상품을 포함하여 주문하신 경우에는 구매금액에 관계없이 무료로 배송해 드립니다.

닫기

리뷰쓰기

닫기
* 상품명 :
실전 하둡 운용 가이드 : 대규모 하둡 클러스터 관리를 위한 필수 노하우
* 제목 :
* 별점평가
* 내용 :

* 리뷰 작성시 유의사항

글이나 이미지/사진 저작권 등 다른 사람의 권리를 침해하거나 명예를 훼손하는 게시물은 이용약관 및 관련법률에 의해 제재를 받을 수 있습니다.

1. 특히 뉴스/언론사 기사를 전문 또는 부분적으로 '허락없이' 갖고 와서는 안됩니다 (출처를 밝히는 경우에도 안됨).
2. 저작권자의 허락을 받지 않은 콘텐츠의 무단 사용은 저작권자의 권리를 침해하는 행위로, 이에 대한 법적 책임을 지게 될 수 있습니다.

오탈자 등록

닫기
* 도서명 :
실전 하둡 운용 가이드 : 대규모 하둡 클러스터 관리를 위한 필수 노하우
* 구분 :
* 상품 버전
종이책 PDF ePub
* 페이지 :
* 위치정보 :
* 내용 :

도서 인증

닫기
도서명*
실전 하둡 운용 가이드 : 대규모 하둡 클러스터 관리를 위한 필수 노하우
구입처*
구입일*
부가기호*
부가기호 안내

* 온라인 또는 오프라인 서점에서 구입한 도서를 인증하면 마일리지 500점을 드립니다.

* 도서인증은 일 3권, 월 10권, 년 50권으로 제한되며 절판도서, eBook 등 일부 도서는 인증이 제한됩니다.

* 구입하지 않고, 허위로 도서 인증을 한 것으로 판단되면 웹사이트 이용이 제한될 수 있습니다.

닫기

해당 상품을 장바구니에 담았습니다.이미 장바구니에 추가된 상품입니다.
장바구니로 이동하시겠습니까?

자료실

최근 본 상품1