책의 구성 자체는 호기심을 자극할만한 요소들로 가득차 있지만,
번역 자체의 퀄리티가 떨어진다.
내용을 읽다보면 무슨말이었는지 문맥이 이어지지가 않는다.
실시간 분석 솔루션을 구축하기 위한 가장 완벽한 지침서
빠른 비즈니스 의사결정을 위해 실시간 분석에 대한 관심이 고조되고 있다. 이 책은 스트리밍 데이터의 분석에서 시각화까지 전 단계를 망라하는 가성비 높은 솔루션을 제시한다. 1부는 아파치 주키퍼, 카프카, 플룸, 스톰, 얀, 삼자, 레디스, 몽고DB, 카산드라 등으로 실시간 분석 서비스를 구성하고 데이터를 처리 및 저장하는 방법을 다룬다. 2부는 SVG와 D3.js를 활용하여 데이터를 시각화하고 모니터링하고 실시간에 맞게 최적화하는 방법을 살펴본다. 실무 관점에서 다양한 기술의 활용 및 구성 로드맵을 제시하여, 나무가 아니라 숲을 볼 수 있게 해주는 책이다.
빅데이터 분석의 새로운 패러다임 실시간 분석 솔루션 구축 가이드
많은 기업이 실시간으로 발생하는 데이터로부터 빠른 비즈니스 인사이트를 얻기 위해 부단히 노력하고 있다. 데이터를 저장한 후 분석하는 기존 배치 방식은 인사이트 확보 타이밍을 제대로 맞추기 어려웠다. 이에 적시에 신속히 중대 의사결정을 내릴 수 있도록 프로세스 시간을 획기적으로 단축해주는 실시간 분석 솔루션에 대한 관심이 고조되고 있다.
이 책은 이러한 트렌드에 맞춰, 스트리밍 데이터의 수집, 전달, 처리, 저장, 시각화까지 실시간 분석의 전 단계를 망라하는 가성비 높은 솔루션을 구축하는 지침을 제공한다. 스트리밍 데이터의 특성을 살펴본 다음(1장), 1부는 아파치 주키퍼, 카프카, 플룸, 스톰, 얀, 삼자, 레디스, 몽고DB, 카산드라 등으로 실시간 분석 서비스를 설계 및 구성하고(2~3장) 데이터를 처리 및 저장(4~6장)하는 방법을 알아본다. 2부는 SVG와 D3.js를 활용하여 데이터를 시각화하고(7~8장), 데이터를 표집하고 추정값을 얻어내는 데 사용하는 통계 기법과 알고리즘을 살펴본다(9~10장). 끝으로 실시간 데이터를 모니터링하고 실시간에 맞게 최적화하는 고급 기법을 살펴본다(11장).
관련 기술이 워낙 많고 빨리 변하다 보니 개별 기술은 알아도 그것을 실무에서 어떻게 사용할지 곤혹스러워하는 경우가 많다. 이에 실시간 처리에 꼭 필요한 기술이 어떤 흐름에 따라 유기적으로 활용되는지 길을 제시해주는 이 책의 가치가 더 크다. 실무 관점에서 다양한 기술의 활용 및 구성 로드맵을 제시하여, 나무가 아니라 숲을 볼 수 있게 해주는 책이다.
1. 스트리밍 데이터 소개
1.1 스트리밍 데이터의 원천
1.2 스트리밍 데이터만의 특징
1.3 인프라 및 알고리즘
1.4 마치며
1부. 스트리밍 분석 아키텍처
2. 실시간 스트리밍 아키텍처 설계
2.1 실시간 아키텍처의 구성요소
2.2 실시간 아키텍처의 특징
2.3 실시간 프로그래밍을 위한 언어
2.4 실시간 아키텍처 체크리스트
2.5 마치며
3. 서비스 구성 및 조정
3.1 구성 및 조정 시스템의 출현 배경
3.2 분산 상태 유지
3.3 아파치 주키퍼
3.4 마치며
4. 스트리밍 분석에서의 데이터 흐름 관리
4.1 분산 데이터 흐름
4.2 아파치 카프카: 높은 처리량을 가지는 분산 메시징
4.3 아파치 플룸: 분산 로그 수집
4.4 마치며
5. 스트리밍 데이터 처리
5.1 분산 스트리밍 데이터 처리
5.2 스톰을 이용한 데이터 처리
5.3 삼자를 이용한 데이터 처리
5.4 마치며
6. 스트리밍 데이터 저장
6.1 일관된 해싱
6.2 NoSQL 저장 시스템
6.3 기타 저장 기술
6.4 기술 선택하기
6.5 웨어하우징
6.6 마치며
2부. 분석 및 시각화
7. 스트리밍 메트릭 전달
7.1 스트리밍 웹 애플리케이션
7.2 데이터 시각화하기
7.3 모바일 스트리밍 애플리케이션
7.4 마치며
8. 정확한 집계와 전달
8.1 특정 시점 카운팅과 합계
8.2 다중 해상도 시계열 집계
8.3 확률적 최적화
8.4 시계열 데이터 전송
8.5 마치며
9. 스트리밍 데이터의 통계적 근사
9.1 수치 라이브러리
9.2 확률과 분포
9.3 분포 살펴보기
9.4 난수 생성
9.5 표집 절차
9.6 마치며
10. 스케치를 이용한 스트리밍 데이터 근사
10.1 레지스터와 해시 함수
10.2 집합
10.3 블룸 필터
10.4 고유 값 스케치
10.5 카운트-최소 스케치
10.6 다른 애플리케이션
10.7 마치며
11. 단순 집계를 넘어서는 고급 기법
11.1 실시간 데이터를 위한 모형
11.2 모형 예측
11.3 모니터링
11.4 실시간 최적화
11.5 마치며
엔지니어를 위한 데이터 시각화 : D3.js로 배우는 데이터 시각화 이론과 12가지 사례
모리후지 다이치 , 안티베이지안