메뉴 바로가기 검색 및 카테고리 바로가기 본문 바로가기

한빛출판네트워크

한빛랩스 - 지식에 가능성을 머지하다 / 강의 콘텐츠 무료로 수강하시고 피드백을 남겨주세요. ▶︎

핸즈온 머신러닝(3판)

사이킷런, 케라스, 텐서플로 2로 완벽 이해하는 머신러닝, 딥러닝 이론 & 실무

한빛미디어

번역서

판매중

  • 저자 : 오렐리앙 제롱(Aurélien Géron)
  • 번역 : 박해선
  • 출간 : 2023-09-29
  • 페이지 : 1044 쪽
  • ISBN : 9791169211475
  • 물류코드 :11147
  • 구판정보 :이 도서는 <핸즈온 머신러닝(2판)>의 개정판입니다. 구판 정보 보기
  • 초급 초중급 중급 중고급 고급
4.9점 (37명)
좋아요 : 33

---- 정오표 한눈에 보기 https://tensorflow.blog/handson-ml3/ ----


실무 밀착형 예제부터 스테이블 디퓨전 등 최신 머신러닝 트렌드까지 

주요 인공 지능 콘퍼런스에서 전문가들이 소개한 최고의 실전 지침서

** 독자의 편의를 고려한 분권(1권, 2권)

** 최신 라이브러리 버전으로 전체 코드 업데이트

** <연습문제 + 해답>, <머신러닝 프로젝트 체크리스트> 수록

 

 

수학에 『수학의 정석』이 있다면 인공 지능에는 『핸즈온 머신러닝』이 있다!

 

1판과 2판의 피드백을 적극 반영해 한층 더 업그레이드된 『핸즈온 머신러닝』이 3판으로 돌아왔습니다. ‘실제로 머신러닝을 구현하면서 학습한다’는 목표를 더욱 효과적으로 달성할 수 있도록 복잡한 주제를 구조화하고 난이도에 따라 순차적으로 학습할 수 있게 개선했습니다. 또한 누구나 쉽게 이해할 수 있도록 기존 설명을 더 친절하고 명확하게 다듬고 보완했습니다. 마지막으로, 빠르게 발전하는 분야인 만큼 전체 코드 버전과 기술 트렌드를 최신 정보로 업데이트했습니다(하단의 ‘출판사 리뷰’에서 3판의 업데이트 내용을 확인할 수 있습니다).

 

 

머신러닝을 전혀 모르는 입문자도 온라인으로 제공되는 주피터 노트북을 활용해 손쉽게 실습할 수 있습니다. 여기에 박해선 역자의 친절한 추가 설명까지 더해져 답답함 없이 수월하게 학습할 수 있습니다.

 

상세이미지_700_핸즈온 머신러닝(3판)_수정.jpg

 

오렐리앙 제롱(Aurélien Géron) 저자

오렐리앙 제롱(Aurélien Géron)

머신러닝 컨설턴트입니다. 2013년에서 2016년까지 구글에서 유튜브 동영상 분류 팀을 이끌었습니다. 2002년에서 2012년까지 프랑스의 모바일 ISP 선두 주자인 위퍼스트 Wifirst를 설립하고 CTO로 일했습니다. 2001년에는 폴리콘셀 Polyconseil을 설립하고 CTO로 일했습니다. 이 회사는 지금 전기차 공유 서비스인 오토립 Autolib′을 운영하고 있습니다.

그전에는 재무(J. P. 모건과 소시에테 제네랄 Société Générale ), 방위(캐나다 국방부), 의료(수혈) 등 다양한 분야에서 엔지니어로 일했습니다. C++, WiFi, 인터넷 구조에 관한 기술 서적 몇 권을 집필했으며 프랑스의 한 공과대학에서 컴퓨터과학을 가르쳤습니다.

 

 

박해선 역자

박해선

기계공학을 전공했지만 졸업 후엔 줄곧 코드를 읽고 쓰는 일을 했습니다. 블로그(tensorflow.blog)에 글을 쓰고 머신러닝과 딥러닝에 관한 책을 집필, 번역하면서 소프트웨어와 과학의 경계를 흥미롭게 탐험하고 있습니다.

『챗GPT로 대화하는 기술』(한빛미디어, 2023), 『혼자 공부하는 데이터 분석 with 파이썬』(한빛미디어, 2023), 『혼자 공부하는 머신러닝+딥러닝』(한빛미디어, 2020), 『Do it! 딥러닝 입문』(이지스퍼블리싱, 2019)을 집필했습니다.

『실무로 통하는 ML 문제 해결 with 파이썬』(한빛미디어, 2024), 『머신러닝 교과서: 파이토치 편』(길벗, 2023), 『스티븐 울프럼의 챗GPT 강의』(한빛미디어, 2023), 『핸즈온 머신러닝(3판)』(한빛미디어, 2023), 『만들면서 배우는 생성 AI』(한빛미디어, 2023), 『코딩 뇌를 깨우는 파이썬』(한빛미디어, 2023), 『트랜스포머를 활용한 자연어 처리』(한빛미디어, 2022), 『케라스 창시자에게 배우는 딥러닝 2판』(길벗, 2022), 『개발자를 위한 머신러닝&딥러닝』(한빛미디어, 2022), 『XGBoost와 사이킷런을 활용한 그레이디언트 부스팅』(한빛미디어, 2022), 『구글 브레인 팀에게 배우는 딥러닝 with TensorFlow.js』(길벗, 2022), 『파이썬 라이브러리를 활용한 머신러닝(번역개정2판)』(한빛미디어, 2022), 『머신러닝 파워드 애플리케이션』(한빛미디어, 2021), 『머신 러닝 교과서 with 파이썬, 사이킷런, 텐서플로(개정3판)』(길벗,2021)를 포함하여 여러 권의 책을 우리말로 옮겼습니다.

 

[1부 머신러닝]

 

1장 한눈에 보는 머신러닝

1.1 머신러닝이란?

1.2 왜 머신러닝을 사용하나요?

1.3 애플리케이션 사례

1.4 머신러닝 시스템의 종류

_1.4.1 훈련 지도 방식

__지도 학습

__비지도 학습

__준비도 학습

__자기 지도 학습

__강화 학습

_1.4.2 배치 학습과 온라인 학습

__배치 학습

__온라인 학습

_1.4.3 사례 기반 학습과 모델 기반 학습

__사례 기반 학습

__모델 기반 학습

1.5 머신러닝의 주요 도전 과제

_1.5.1 충분하지 않은 양의 훈련 데이터

_1.5.2 대표성 없는 훈련 데이터

_1.5.3 낮은 품질의 데이터

_1.5.4 관련없는 특성

_1.5.5 훈련 데이터 과대적합

_1.5.6 훈련 데이터 과소적합

_1.5.7 핵심 요약

1.6 테스트와 검증

_1.6.1 하이퍼파라미터 튜닝과 모델 선택

_1.6.2 데이터 불일치

연습문제

 

 

2장 머신러닝 프로젝트 처음부터 끝까지

2.1 실제 데이터로 작업하기

2.2 큰 그림 보기

_2.2.1 문제 정의

_2.2.2 성능 측정 지표 선택

_2.2.3 가정 검사

2.3 데이터 가져오기

_2.3.1 구글 코랩을 사용하여 예제 코드 실행하기

_2.3.2 코드와 데이터 저장하기

_2.3.3 대화식 환경의 편리함과 위험

_2.3.4 책의 코드와 노트북의 코드

_2.3.5 데이터 다운로드

_2.3.6 데이터 구조 훑어보기

_2.3.7 테스트 세트 만들기

2.4 데이터 이해를 위한 탐색과 시각화

_2.4.1 지리적 데이터 시각화하기

_2.4.2 상관관계 조사하기

_2.4.3 특성 조합으로 실험하기

2.5 머신러닝 알고리즘을 위한 데이터 준비

_2.5.1 데이터 정제

_2.5.2 텍스트와 범주형 특성 다루기

_2.5.3 특성 스케일과 변환

_2.5.4 사용자 정의 변환기

_2.5.5 변환 파이프라인

2.6 모델 선택과 훈련

_2.6.1 훈련 세트에서 훈련하고 평가하기

_2.6.2 교차 검증으로 평가하기

2.7 모델 미세 튜닝

_2.7.1 그리드 서치

_2.7.2 랜덤 서치

_2.7.3 앙상블 방법

_2.7.4 최상의 모델과 오차 분석

_2.7.5 테스트 세트로 시스템 평가하기

2.8 론칭, 모니터링, 시스템 유지 보수

2.9 직접 해보세요!

연습문제

 

3장 분류

3.1 MNIST

3.2 이진 분류기 훈련

3.3 성능 측정

_3.3.1 교차 검증을 사용한 정확도 측정

_3.3.2 오차 행렬

_3.3.3 정밀도와 재현율

_3.3.4 정밀도/재현율 트레이드오프

_3.3.5 ROC 곡선

3.4 다중 분류

3.5 오류 분석

3.6 다중 레이블 분류

3.7 다중 출력 분류

연습문제

 

4장 모델 훈련

4.1 선형 회귀

_4.1.1 정규 방정식

_4.1.2 계산 복잡도

4.2 경사 하강법

_4.2.1 배치 경사 하강법

_4.2.2 확률적 경사 하강법

_4.2.3 미니배치 경사 하강법

4.3 다항 회귀

4.4 학습 곡선

4.5 규제가 있는 선형 모델

_4.5.1 릿지 회귀

_4.5.2 라쏘 회귀

_4.5.3 엘라스틱넷

_4.5.4 조기 종료

4.6 로지스틱 회귀

_4.6.1 확률 추정

_4.6.2 훈련과 비용 함수

_4.6.3 결정 경계

_4.6.4 소프트맥스 회귀

연습문제

 

5장 서포트 벡터 머신

5.1 선형 SVM 분류

_5.1.1 소프트 마진 분류

5.2 비선형 SVM 분류

_5.2.1 다항식 커널

_5.2.2 유사도 특성

_5.2.3 가우스 RBF 커널

_5.2.4 계산 복잡도

5.3 SVM 회귀

5.4 SVM 이론

5.5 쌍대 문제

_5.5.1 커널 SVM

연습문제

 

6장 결정 트리

6.1 결정 트리 학습과 시각화

6.2 예측

6.3 클래스 확률 추정

6.4 CART 훈련 알고리즘

6.5 계산 복잡도

6.6 지니 불순도 또는 엔트로피?

6.7 규제 매개변수

6.8 회귀

6.9 축 방향에 대한 민감성

6.10 결정 트리의 분산 문제

연습문제

 

7장 앙상블 학습과 랜덤 포레스트

7.1 투표 기반 분류기

7.2 배깅과 페이스팅

_7.2.1 사이킷런의 배깅과 페이스팅

_7.2.2 OOB 평가

7.3 랜덤 패치와 랜덤 서브스페이스

7.4 랜덤 포레스트

_7.4.1 엑스트라 트리

_7.4.2 특성 중요도

7.5 부스팅

7.5.1 AdaBoost

_7.5.2 그레이디언트 부스팅

_7.5.3 히스토그램 기반 그레이디언트 부스팅

_7.6 스태킹

연습문제

 

8장 차원 축소

8.1 차원의 저주

8.2 차원 축소를 위한 접근법

_8.2.1 투영

_8.2.2 매니폴드 학습

8.3 주성분 분석

_8.3.1 분산 보존

_8.3.2 주성분

_8.3.3 d차원으로 투영하기

_8.3.4 사이킷런 사용하기

_8.3.5 설명된 분산의 비율

_8.3.6 적절한 차원 수 선택

_8.3.7 압축을 위한 PCA

_8.3.8 랜덤 PCA

_8.3.9 점진적 PCA

8.4 랜덤 투영

8.5 지역 선형 임베딩

8.6 다른 차원 축소 기법

연습문제

 

9장 비지도 학습

9.1 군집

_9.1.1 k-평균

__k-평균 알고리즘

__센트로이드 초기화 방법

__k-평균 속도 개선과 미니배치 k-평균

__최적의 클러스터 개수 찾기

_9.1.2 k-평균의 한계

_9.1.3 군집을 사용한 이미지 분할

_9.1.4 군집을 사용한 준지도 학습

_9.1.5 DBSCAN

_9.1.6 다른 군집 알고리즘

9.2 가우스 혼합

_9.2.1 가우스 혼합을 사용한 이상치 탐지

_9.2.2 클러스터 개수 선택

_9.2.3 베이즈 가우스 혼합 모델

_9.2.4 이상치 탐지와 특이치 탐지를 위한 알고리즘

연습문제

 

[2부 신경망과 딥러닝]

 

10장 케라스를 사용한 인공 신경망 소개

10.1 생물학적 뉴런에서 인공 뉴런까지

_10.1.1 생물학적 뉴런

_10.1.2 뉴런을 사용한 논리 연산

_10.1.3 퍼셉트론

_10.1.4 다층 퍼셉트론과 역전파

_10.1.5 회귀를 위한 다층 퍼셉트론

_10.1.6 분류를 위한 다층 퍼셉트론

10.2 케라스로 다층 퍼셉트론 구현하기

_10.2.1 시퀀셜 API로 이미지 분류기 만들기

__케라스로 데이터셋 적재하기

__시퀀셜 API로 모델 만들기

__모델 컴파일

__모델 훈련과 평가

__모델로 예측 만들기

_10.2.2 시퀀셜 API로 회귀용 다층 퍼셉트론 만들기

_10.2.3 함수형 API로 복잡한 모델 만들기

_10.2.4 서브클래싱 API로 동적 모델 만들기

_10.2.5 모델 저장과 복원하기

_10.2.6 콜백 사용하기

_10.2.7 텐서보드로 시각화하기

10.3 신경망 하이퍼파라미터 튜닝하기

_10.3.1 은닉 층 개수

_10.3.2 은닉 층의 뉴런 개수

_10.3.3 학습률, 배치 크기 그리고 다른 하이퍼파라미터

연습문제

 

11장 심층 신경망 훈련

11.1 그레이디언트 소실과 폭주 문제

_11.1.1 글로럿과 He 초기화

_11.1.2 고급 활성화 함수

__LeakyReLU

__ELU와 SELU

__GELU, Swish, Mish

_11.1.3 배치 정규화

__케라스로 배치 정규화 구현하기

_11.1.4 그레이디언트 클리핑

11.2 사전 훈련된 층 재사용하기

_11.2.1 케라스를 사용한 전이 학습

_11.2.2 비지도 사전 훈련

_11.2.3 보조 작업에서 사전 훈련

11.3 고속 옵티마이저

_11.3.1 모멘텀 최적화

_11.3.2 네스테로프 가속 경사

_11.3.3 AdaGrad

_11.3.4 RMSProp

_11.3.5 Adam

_11.3.6 AdaMax

_11.3.7 Nadam

_11.3.8 AdamW

_11.3.9 학습률 스케줄링

11.4 규제를 사용해 과대적합 피하기

_11.4.1 l1과 l2 규제

_11.4.2 드롭아웃

_11.4.3 몬테 카를로 드롭아웃

_11.4.4 맥스-노름 규제

11.5 요약 및 실용적인 가이드라인

연습문제

 

12장 텐서플로를 사용한 사용자 정의 모델과 훈련

12.1 텐서플로 훑어보기

12.2 넘파이처럼 텐서플로 사용하기

_12.2.1 텐서와 연산

_12.2.2 텐서와 넘파이

_12.2.3 타입 변환

_12.2.4 변수

_12.2.5 다른 데이터 구조

12.3 사용자 정의 모델과 훈련 알고리즘

_12.3.1 사용자 정의 손실 함수

_12.3.2 사용자 정의 요소를 가진 모델을 저장하고 로드하기

_12.3.3 활성화 함수, 초기화, 규제, 제한을 커스터마이징하기

_12.3.4 사용자 정의 지표

_12.3.5 사용자 정의 층

_12.3.6 사용자 정의 모델

_12.3.7 모델 구성 요소에 기반한 손실과 지표

_12.3.8 자동 미분으로 그레이디언트 계산하기

_12.3.9 사용자 정의 훈련 반복

12.4 텐서플로 함수와 그래프

_12.4.1 오토그래프와 트레이싱

_12.4.2 텐서플로 함수 사용법

연습문제

 

13장 텐서플로를 사용한 데이터 적재와 전처리

13.1 데이터 API

_13.1.1 연쇄 변환

_13.1.2 데이터 셔플링

_13.1.3 여러 파일에서 한 줄씩 번갈아 읽기

_13.1.4 데이터 전처리

_13.1.5 데이터 적재와 전처리 합치기

_13.1.6 프리페치

_13.1.7 케라스와 데이터셋 사용하기

13.2 TFRecord 포맷

_13.2.1 압축된 TFRecord 파일

_13.2.2 프로토콜 버퍼 개요

_13.2.3 텐서플로 프로토콜 버퍼

_13.2.4 Example 프로토콜 버퍼 읽고 파싱하기 

_13.2.5 SequenceExample 프로토콜 버퍼로 리스트의 리스트 다루기

13.3 케라스의 전처리 층

_13.3.1 Normalization 층

_13.3.2 Discretization 층

_13.3.3 CategoryEncoding 층

_13.3.4 StringLookup 층

_13.3.5 Hashing 층

_13.3.6 임베딩을 사용해 범주형 특성 인코딩하기

_13.3.7 텍스트 전처리

_13.3.8 사전 훈련된 언어 모델 구성 요소 사용하기

_13.3.9 이미지 전처리 층

13.5 텐서플로 데이터셋 프로젝트

연습문제

 

14장 합성곱 신경망을 사용한 컴퓨터 비전

14.1 시각 피질 구조

14.2 합성곱 층

_14.2.1 필터

_14.2.2 여러 가지 특성 맵 쌓기

_14.2.3 케라스로 합성곱 층 구현하기

_14.2.4 메모리 요구 사항

14.3 풀링 층

14.4 케라스로 풀링 층 구현하기

14.5 CNN 구조

_14.5.1 LeNet-5

_14.5.2 AlexNet

_14.5.3 GoogLeNet

_14.5.4 VGGNet

_14.5.5 ResNet

_14.5.6 Xception

_14.5.7 SENet

_14.5.8 주목할 만한 다른 구조

_14.5.9 올바른 CNN 구조 선택

14.6 케라스로 ResNet-34 CNN 구현하기

14.7 케라스의 사전 훈련 모델 사용하기

14.8 사전 훈련된 모델을 사용한 전이 학습

14.9 분류와 위치 추정

14.10 객체 탐지

_14.10.1 완전 합성곱 신경망

_14.10.2 YOLO

14.11 객체 추적

14.12 시맨틱 분할

연습문제

 

15장 RNN과 CNN을 사용한 시퀀스 처리

15.1 순환 뉴런과 순환 층

_15.1.1 메모리 셀

_15.1.2 입력과 출력 시퀀스

15.2 RNN 훈련하기

15.3 시계열 예측하기

_15.3.1 ARMA 모델

_15.3.2 머신러닝 모델을 위한 데이터 준비하기

_15.3.3 선형 모델로 예측하기

_15.3.4 간단한 RNN으로 예측하기

_15.3.5 심층 RNN으로 예측하기

_15.3.6 다변량 시계열 예측하기

_15.3.7 여러 타임 스텝 앞 예측하기

_15.3.8 시퀀스-투-시퀀스 모델로 예측하기

15.4 긴 시퀀스 다루기

_15.4.1 불안정한 그레이디언트 문제와 싸우기

_15.4.2 단기 기억 문제 해결하기

__LSTM 셀

__GRU 셀

__1D 합성곱 층으로 시퀀스 처리하기

__WaveNet

연습문제

 

16장 RNN과 어텐션을 사용한 자연어 처리

16.1 Char-RNN으로 셰익스피어 문체 생성하기

_16.1.1 훈련 데이터셋 만들기

_16.1.2 Char-RNN 모델 만들고 훈련하기

_16.1.3 가짜 셰익스피어 텍스트 생성하기

_16.1.4 상태가 있는 RNN

16.2 감성 분석

_16.2.1 마스킹

_16.2.2 사전 훈련된 임베딩과 언어 모델 재사용하기

16.3 신경망 기계 번역을 위한 인코더-디코더 네트워크

_16.3.1 양방향 RNN

_16.3.2 빔 서치

16.4 어텐션 메커니즘

_16.4.1 트랜스포머 구조: 어텐션만 있으면 된다

__위치 인코딩

__멀티 헤드 어텐션

16.5 언어 모델 분야의 최근 혁신

16.6 비전 트랜스포머

16.7 허깅 페이스의 트랜스포머스 라이브러리

연습문제

 

17장 오토인코더, GAN 그리고 확산 모델

17.1 효율적인 데이터 표현

17.2 과소완전 선형 오토인코더로 PCA 수행하기

17.3 적층 오토인코더

_17.3.1 케라스로 적층 오토인코더 구현하기

_17.3.2 재구성 시각화

_17.3.3 패션 MNIST 데이터셋 시각화

_17.3.4 적층 오토인코더를 사용한 비지도 사전 훈련

_17.3.5 가중치 묶기

_17.3.6 오토인코더 한 개씩 훈련하기

17.4 합성곱 오토인코더

17.5 잡음 제거 오토인코더

17.6 희소 오토인코더

17.7 변이형 오토인코더

_17.7.1 패션 MNIST 이미지 생성하기

17.8 생성적 적대 신경망

_17.8.1 GAN 훈련의 어려움

_17.8.2 심층 합성곱 GAN

_17.8.3 ProGAN

__미니배치 표준 편차 층

__동일한 학습 속도

__픽셀별 정규화 층

_17.8.4 StyleGAN

__매핑 네트워크

__합성 네트워크

17.9 확산 모델

연습문제

 

18장 강화 학습

18.1 보상을 최적화하기 위한 학습

18.2 정책 탐색

18.3 OpenAI Gym

18.4 신경망 정책

18.5 행동 평가: 신용 할당 문제

18.6 정책 그레이디언트

18.7 마르코프 결정 과정

18.8 시간차 학습

18.9 Q-러닝

_18.9.1 탐험 정책

_18.9.2 근사 Q-러닝과 심층 Q-러닝

18.10 심층 Q-러닝 구현

18.11 심층 Q-러닝의 변형

_18.11.1 고정 Q-가치 타깃

_18.11.2 더블 DQN

_18.11.3 우선 순위 기반 경험 재생

_18.11.4 듀얼링 DQN

18.12 다른 강화 학습 알고리즘

연습문제

 

19장 대규모 텐서플로 모델 훈련과 배포

19.1 텐서플로 모델 서빙

_19.1.1 텐서플로 서빙 사용하기

__SavedModel로 내보내기

__텐서플로 서빙 설치하고 시작하기

__REST API로 TF 서빙에 쿼리하기

__gRPC API로 TF 서빙에 쿼리하기

__새로운 버전의 모델 배포하기

_19.1.2 버텍스 AI에서 예측 서비스 만들기

_19.1.3 버텍스 AI에서 배치 예측 작업 실행하기

19.2 모바일 또는 임베디드 디바이스에 모델 배포하기

19.3 웹 페이지에서 모델 실행하기

19.4 계산 속도를 높이기 위해 GPU 사용하기

_19.4.1 GPU 구매하기

_19.4.2 GPU RAM 관리하기

_19.4.3 디바이스에 연산과 변수 할당하기

_19.4.4 다중 장치에서 병렬 실행하기

19.5 다중 장치에서 모델 훈련하기

_19.5.1 모델 병렬화

_19.5.2 데이터 병렬화

__미러드 전략을 사용한 데이터 병렬화

__중앙 집중적인 파라미터를 사용한 데이터 병렬화

__대역폭 포화

_19.5.3 분산 전략 API를 사용한 대규모 훈련

_19.5.4 텐서플로 클러스터에서 모델 훈련하기

_19.5.5 버텍스 AI에서 대규모 훈련 작업 실행하기

_19.5.6 버텍스 AI의 하이퍼파라미터 튜닝

연습문제

마치며

 

[3부 부록]

 

부록 A 연습문제 정답

 

부록 B 머신러닝 프로젝트 체크리스트

B.1 문제를 정의하고 큰 그림을 그립니다

B.2 데이터를 수집합니다

B.3 데이터를 탐색합니다

B.4 데이터를 준비합니다

B.5 가능성 있는 몇 개의 모델을 고릅니다

B.6 모델을 미세 튜닝합니다

B.7 솔루션을 출시합니다

B.8 시스템을 론칭합니다!

 

부록 C 자동 미분

C.1 수동 미분

C.2 유한 차분 근사

C.3 전진 모드 자동 미분

C.4 후진 모드 자동 미분

 

부록 D 특수한 데이터 구조

D.1 문자열

D.2 래그드 텐서

D.3 희소 텐서

D.4 텐서 배열

D.5 집합

D.6 큐

 

부록 E 텐서플로 그래프

E.1 TF 함수와 콘크리트 함수

E.2 함수 정의와 함수 그래프 탐험하기

E.3 트레이싱 자세히 보기

E.4 오토그래프로 제어 흐름 표현하기

E.5 TF 함수에서 변수와 다른 리소스 다루기

E.6 케라스로 TF 함수 사용하기(또는 사용하기 않기)

초보자와 전문가 모두를 만족시킨 전 세계 1위 베스트셀러 

 

이 책은 이론과 실습을 아우르며 머신러닝과 딥러닝 모두를 관통하는 큰 그림을 그릴 수 있도록 돕습니다. 특히 도식을 활용한 설명과 최신 버전의 실무 밀착형 코드 예제를 통해 손쉽게 모델을 훈련하고 신경망을 구축하는 방법을 익힐 수 있습니다. 또한 장마다 제공되는 연습문제를 풀면서 배운 내용을 복습하고 자신의 프로젝트에 적용해볼 수 있습니다. 파이썬 프로그래밍 경험이 있다면 바로 시작해보세요. 누구나 머신러닝 전문가가 될 수 있습니다!

 

** 3판에서 업데이트된 내용 **

● 코드 전체를 최신 라이브러리 버전으로 업데이트

● 상세한 모델 선택 가이드라인

● 사이킷런과 케라스의 새로운 기능

○ 사이킷런: 특성 이름 추적, 히스토그램 기반 그레이디언트 부스팅, 레이블 전파 등

○ 케라스: 전처리 층, 데이터 증식 층 등

2판에 없는 라이브러리 추가

하이퍼파라미터 튜닝을 위한 케라스 튜너 라이브러리

자연어 처리를 위한 허깅 페이스의 트랜스포머스 라이브러리

확산 모델(스테이블 디퓨전)

컴퓨터 비전, 자연어 처리 분야의 최신 트렌드와 구현

 

** 누구를 위한 책인가요? **

기초 지식은 있지만 실무 경험이 적은 초보자

실무 능력을 향상시키고 싶은 중급자

머신러닝을 프로젝트에 활용하고 싶은 개발자와 엔지니어

머신러닝 연구나 데이터 분석 작업을 하는 데이터 과학자와 연구자

 

** 이 책의 장점 **

1. 복잡한 이론을 나열하지 않고 실용적인 예제를 통해 자세히 설명합니다.

2. 직접 실습해보면서 실무 문제 해결 능력을 기르고 자신만의 포트폴리오를 완성할 수 있습니다.

3. 여러 가지 머신러닝 및 딥러닝 모델과 도구, 라이브러리에 관한 지식을 확장할 수 있습니다.

4. 스테이블 디퓨전을 비롯한 최신 컴퓨터 비전, 자연어 처리, 강화 학습 트렌드를 반영했습니다.

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

이 책은 압도적인 두꺼움을 자랑하는 책이다. 1000페이지가 넘는 책으로써 굉장히 무거울 것은 예상을 하고 있었다. 하지만 센스있게 한빛미디어에서는 2권으로 분권을 할 수 있도록 해주었다.

역자로써는 박해선이 워낙 유명하신 분이라 따로 언급할 필요는 없는 것 같습니다. 모든 페이지가 풀 컬러여서 가독성이 굉장히 띄어납니다.

다만 아쉬운 점이라면 수학적인 부분이 많이 빠져 있는 것인데, 수학적인 부분까지 들어갔가면 거의 백과사전?처럼 될 것 같긴 해서 지금이 딱 좋을 거 같다고 느꼈습니다.

이 책은 초급이 보기에는 좀 어려울 것 같고 중급 정도가 보기엔 적당한 책이라고 생각이 듭니다. 또한 이것만 보기보다는 개념들을 찾아보시면서 같이 학습을 한다면 좋다고 생각하였습니다. 머신러닝/딥러닝은 어렵지만 이 책과 함께라면 해볼만하지 않을까 싶습니다. 머신러닝/딥러닝을 공부하는 사람이 있다면 꼭 추천 해주고 싶습니다

[책] 핸즈온 머신러닝(3판)

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

AI와 머신러닝의 대 범람 시대에 제3판까지 (비록 번역서지만..) 나오며 살아 남았다는 점에서 기본 신뢰가 생겼었다.

하지만 그럼에도 불구하고 책을 읽기 전이건 책을 읽는 중이건 책을 다 읽은 후이건 잊지 않았던 것은, 

이 책에서 다루고 있는 내용은 AI과 머신러닝이라는 큰 영역을 전체적으로 조망한다는 관점에서 봐야 한다는 것이고

또 절대 하지 않았던 것은 이 책 하나 만으로 머신러닝을 완전히 이해하게 될것이라는 믿음을 갖지 않았다는 것이다.

 

다르게 말하면 이 책을 읽고서 새로이 알게되는 것도 많겠지만 

분명 책의 컨셉에 의해서 자세한 부분이 생략되어 있고 개인마다 궁금해하는 부분을 백프로 긁어줄수 없기에

독자가 이해를 잘하지 못하고 스스로 부족하게 느껴질때가 있는것이 당연하다는 것이다.

이는 독자의 잘못이 아니며 또한 책의 저자의 잘못도 아니다.

머신러닝이라는 큰 주제를 담고 있으며 전체를 조망해야 할 필요가 있으며 그를 위해 서술된 책이기에

독자의 개인의 취향과 백그라운드 지식에 따라 서로 다른 부분에서 의문이 생기는 것은 당연한 것이다.

 

이렇게 장황하게 리뷰를 작성하는 것은 

다시 한번 말하지만, 누구의 잘못이 아니기에 의기소침해지지 않고 모르는 것, 그리고 더 잘알고 싶은 것은 일단 넘어가고

더 자세히 세분화되어 설명하는 책을 함께 보기를 권한다.

 

이책은 핸즈온 머신러닝이다. 잊고 있던것을 혹은 가물가물하던것을 빠르게 끌어올리기에 좋다.

그렇기에 전체를 조망해 설명을 하는 책이다.

2권의 목차를 보면 RNN, 생성형 AI, 강화 학습을 다룬다.

이 챕터들은 따로 책으로 빼서 설명하는 책도 수두룩 빽빽하다.

 

부디 그러니 본인의 호기심에 따라 더욱 세부적인 분야에 대해 관심을 갖고 더 파고 들기를 바란다.

지금 이해를 하지 못하는 것을 당연하게 받아드리며.

 

이책은 앞서 이야기 한 것 처럼 오래 살아남았다는 점에서 책 내용에 대해선 이야기 할 것이 있을까 싶다.

다만 텐서플로 베이스라는 점에서 ㅜ.ㅜ.. 아쉬움이 남는다.

 

undefined

 

IMG_2556.jpeg

 

 

머신러닝의 배우려는 분들에게 "핸즈온 머신러닝"은 필독서로 꼽히곤 한다. 이번 개정판에서는 기존의 내용에 더해 비지도 학습, 심층 신경망, CNN, GAN 등의 최신 주제를 다루며, 케라스와 텐서플로 2 버전으로 업데이트된 예제 코드를 제공한다.

이 책의 가장 큰 장점은 바로 '핸즈온'이다. 이론적인 내용을 배우는 것뿐만 아니라 실제로 코드를 작성하고 실행해 보면서 머신러닝을 경험할 수 있다. 이를 통해 이론과 실제 사이의 틈을 줄이고, 머신러닝의 복잡한 개념을 이해하는 데 큰 도움이 된다. 블랙박스와 같은 기술을 쉬운 예제와 코드로 학습할 수 있다.

개정판에서는 새로운 컬러 인쇄를 도입하였다. 컬러 인쇄된 기술 서적을 읽어본 적이 있나 싶은데 그림이나 그래프를 이해하는 데 도움이 많이 되었다. 또한, 최신 추세를 반영한 내용과 예제 코드로, 머신러닝의 최신 지식을 다루고 있다. 물론 인공지능 분야가 책에서 다루는 내용과 실무에 필요한 지식이 어느 정도 갭이 있지만 작은 것부터 하나씩 시작해 보려고 한다면 이 책이 최고의 선택이지 아닐지 싶다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

<핸즈온 머신러닝 3판> 한빛미디어.

매번 느끼지만, 머신러닝과 딥러닝을 가장 공부하기 좋은 시기는 언제나 바로 오늘입니다 (고퀄리티의 학습 자료가 점점 더 많이 생기고 있어서). 이번에 서평으로 작성할 ‘핸즈온 머신러닝 (3판)’은 1권, 2권으로 나뉘어 있는 것이 특징으로, 상당히 두꺼운 책이랍니다.

삶을 그래디언트에 비유하여 표현한 옮긴이의 말은 깊은 인상을 남겼는데요, 불안하며 방향을 찾아 나아가는 청년과 안정적이지만 속도가 느려진 사회인의 삶을 그래디언트와 비교하였습니다. 그러나 저는 우리의 삶은 그래디언트처럼 단 한 곳을 향해 가는 것이 아니기에, 너무 불안할 필요가 없다고 느낀답니다. 그래디언트의 목적지는 정해져 있지만, 우리에게는 여러 경로와 선택이 있으며, 그 중 어느 것도 평가될 수 없는 가치를 가지고 있기 때문입니다.

‘핸즈온 머신러닝’이 기존에도 머신러닝과 딥러닝 공부에 많이 추천되던 책이었음은 알고 있었습니다. 수년간 추천되왔기 때문에 빠르게 변화하는 딥러닝의 트렌드를 반영하기보다는, 이 책은 주로 기본적이고 전통적인 내용을 다룰 것이라고 생각해왔었답니다! 그런데 (위 이미지를 보다시피) 1판->2판->3판 변경 사항을 보며 머신러닝과 딥러닝 트랜드 학습을 반영하여 지속적인 업데이트가 이루어지고 있다는 사실을 알고 놀랐습니다. (오랫동안 사랑받아온 이유가 여기에 있었을지도 모르겠네요.) 가령, 3판에는 어텐션은 물론, ViT, GAN, 그리고 Stable Diffusion 내용까지 추가되어 있었습니다. 또 이론 지식 못지않게 실습에 비중을 크게 두고 있다는 점도 장점으로 느껴졌습니다.

많은 분야의 공부가 그렇겠지만, 머신러닝/딥러닝을 공부하기 위해서 알아야 할 내용이 방대한데요. 한 두가지 자료를 졸업하는 것만으로는 와닿을 정도로 이해하기가 어려워서 다양한 관점에서 설명하는 다양한 자료가 동반되어야 하는 것이 일반적입니다. 그걸 아는 저자는 친절하게도 이 책과 함께 공부할 수 있는 참고 자료를 이렇게나 많이 소개해두었습니다.

핸즈온 머신러닝 1권에서는 딥러닝의 선행지식이라고 할 수 있는 머신러닝을 기초에 초점을 맞추어 아홉 챕터에 걸쳐 다루고 있습니다. 관련 수학 지식은 깊게 다루는 편은 아니지만, 해당 내용을 이해할 정도로는 다루고 넘어가는 편이었고요. 모든 내용은 코드와 함께 구체적으로 설명되어 있어서 코드에 진심인 것이 느껴지는 책이었습니다.

또한, 복잡한 개념은 도식을 활용하여 직관적으로 설명하려고 노력한 것이 보였답니다. (경험상 친절하다고 느껴지는 책일수록 도식 활용이 잘 되어있는 편이더라고요.)

이 책의 가장 특별하다고 할 수 있는 부분은 각 챕터 마지막에 수록되어있는 연습문제인데요! 보다시피 지식을 잘 숙지했는지를 테스트하는 이론 문제부터, 직접 코드를 작성해보는 실습 문제도 포함되어 있어, 챕터별 학습을 철저히 하는데 도움을 줍니다.

연습문제에 정말 버릴 것이 없어 보였답니다. 이미 머신러닝/딥러닝을 어느정도 공부해본 사람이라면 연습문제를 보며 복습을 해봐도 좋을 것 같습니다. 또 머신러닝/딥러닝 관련 직무 면접을 준비하는 사람들에게도 상당히 유용할 것 같다는 생각이 들었습니다.

1권에서 딥러닝은 간단한 수준에서 introduction 정도만 하고 마무리됩니다. 머신러닝으로 충분히 문제를 해결할 수 있는 기술자라면, 1권에서 소개되는 내용으로 딥러닝에 살짝 발만 담구어 보는 것 만으로도 충분할 것 같고요. 딥러닝을 공부해야하는 사람이라면 1권 학습을 마친 뒤 2권을 이어서 학습하면 됩니다.

2권에서 본격적으로 딥러닝의 이야기가 시작됩니다. NLP보다는 CV에 초점이 맞춰져 있는 편이고,  딥러닝을 처음 배울 때 만나게 되는 CNN, RNN과 같은 기본적인 모델부터 비교적 최신 모델인 GAN과 디퓨전(확산) 모델, 그리고 강화학습까지 다루고 있어서 꽤 최근의 딥러닝 트렌드까지 맛보기에 충분한 책입니다.

추천 대상

딥러닝 바이블 같은 책입니다. 텐서플로 유저들에게 특히 강추하며, 파이토치를 메인으로 사용하는 사람에게도 (어차피 텐서플로도 알아볼 수준은 되어야 하는 세상이라) 추천하고 싶은 책입니다. 또한 머신러닝과 딥러닝을 처음 배우려는 사람들, 체계적인 지식을 쌓고자 하는 중급자, 그리고 기존 지식을 복습하고 싶은 상급 사용자들 모두에게 추천할 수 있을 정도로 다양한 활용이 가능한 것도 장점인데요. 깊이 있는 이론 설명과 완벽에 가까운 코드 제공, 그리고 풍부한 연습문제 덕분에, 자신의 레벨에 맞게 활용하면 이 책 하나만으로 다양한 학습을 해보실 수 있을 것 같습니다. (여느 AI 부트캠프 수료보다 AI 지식을 공부하는 데에는 더 좋은 선택지가 될 수도 있어 보일 정도로요.)

초급자라면 혼자보다는 그룹 스터디같은 장치가 있으면 훨씬 공부하기 편할 듯 하고, 중급/상급자라면 체계적인 공부를 한번 하고자 하는 사람은 혼자 공부해도 충분할 것으로 보입니다. 저 본인 또한 지식을 보다 체계적으로 부트캠프 수강생들에게 설명하기 위해 이 책을 옆에 끼고 틈틈히 공부하게 될 것 같네요:)

 

“한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.”

오늘 리뷰할 책은 [핸즈온 머신러닝(3판)] 입니다.

https://www.hanbit.co.kr/media/books/book_view.html?p_code=B1539397165

 

 

사실 말이 필요 없는 최고의 책 입니다.워낙 좋은 책이라 이번에 3판이 나온거겠지요.

 

분량도 어마어마 합니다. 1000페이지가 넘어서 1,2권으로 분권되어 있네요.

 

1-표지IMG_20231029_234420.jpg

 

 

가운데를 펼치면 2권 표지도 이렇게 보인다죠. 가운데 2권 이라는 것을 빼고는 앞,1권 표지와 동일합니다.

 

2-2권 표지IMG_20231029_234526.jpg

 

 

 

예전에 머신러닝/딥러닝을 공부할때 봤던 내용들이 많이 있긴 하지만,

사실 머리 속에서 대부분 지워진 내용들이라... 쭈욱 살펴봅니다.

역자 박해선님은 워낙 유명하신 분이니 언급할 필요도 없겠지요?

 

일단 책 앞부분 소개 내용을 보면서 3판의 다른 점을 아래와 같이 알려줍니다.

 

3-3판 변경 사항IMG_20231029_234726.jpg

 

 

 

혹시나해서 미리 알려드리면, 최근 열풍인 chatGPT나 stable difussion/mid journey 같은 툴에 대한 내용은 없습니다. 그러나 그런 것들의 기본 이론이 되는 내용들을 2권에서 충분히 담고 있습니다.

먼저 1권을 보면, 목차부터 심상치 않았는데 모든 페이지가 제가 좋아하는 풀 컬러 인쇄랍니다.

역시 컬러가 가독성 뛰어나고 눈에 쏙쏙 들어옵니다.

 

아래를 보시면 컬러가 아니면 분석이 거의 불가능한 것들이죠.

 

 

 

 

4-군집 시각화 IMG_20231029_235026.jpg

 

위의 시각화는 라벨이 있긴 때문에 대충 구분이라고 가능하지만,

 

 

아래를 보시면 정말 컬러가 아니면 분석 불가능 입니다.

 

5-클러스터 시각화 IMG_20231029_235248.jpg

 

 

머신러닝/딥러닝을 공부할때 가장 중요한 내용이라고 배웠던 것들중에 경사하강법이 있었지요.

이 책에서는 아래 그림과 함께 잘 설명이 되어 있습니다.

 

6-경사하강법 IMG_20231029_235345.jpg

 

 

 

다른 좋은 내용들이 많지만 이제 2권으로 넘어갑니다.

2권의 내용은 텐서플로우의 기본적인 내용에 이어 CNN이 나옵니다. 그 뒤에 RNN이나 GAN, 기타 나머지가 이어지구요.

귀여운 고양이 사진이 아니라서 조금 아쉽지만 YOLO 공부하면서 알게된 시맨틱 분할에 대한 내용도 있습니다.

이 책은 정말 다양한 내용들을 담고 있다는게 사방에 있습니다.

 

7-시맨틱 분할 IMG_20231029_235715.jpg

 

 

GAN에서는 패션 MNIST를 이용해서 설명하고 있네요. 이제는 그림만 봐도 뭔지 대충 알수 있다는 ㅋ

 

8-GAN IMG_20231029_235913.jpg

 

 

이어서는 강화 학습에 대한 내용입니다. 저도 책을 보긴 했지만 아직 공부가 부족해서인지 머리 속에 많이 남지는 않네요.

 

9-강화학습 IMG_20231029_235929.jpg

 

 

 

사실 머신러닝/딥러닝의 내용들이 대부분 쉽지는 않아 혼자 공부하기가 쉽지는 않습니다.

그래서 이 책의 대상도 중급이라고 되어 있습니다. 수많은 공식과 수학적인 내용들이 머리 아프게 만들지만

그래도 이 책과 함께 꾸준히 공부하면 좀 수월하지 않을까 생각됩니다.

상당한 분량의 압박이 있지만 역시 이 책은 너무 좋은 책이라서 그동안 계속 꾸준하게 버전업이 되고 있죠.

머신러닝/딥러닝을 공부하는 사람이라면 꼭 추천하고 싶은 책입니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

 

 

 

 

 

 

 

 

 

 

 

 

이번에 운이 좋게도 "핸즈온 머신러닝 3판" 을 읽어 보게 되었습니다. 

이미 "핸즈온 머신러닝" 책 1판,  2판을 가지고 읽었있는데 이번 3판은 얼마나 바뀌어 있고 어떤 내용이 더 추가 되어 있을지 기대가 많았습니다.

 

먼저 "핸즈온 머신러닝 3판" 은 머신러닝,  신경망, 딥러닝, 인공지능을 공부할때 꼭 읽어봐야 할 책 입니다. 

전세계 1위 베스터셀러이며 이제까지 3판이 나올정도로 머신러닝, 신경망, 딥러닝에 대한 이론, 그림, 설명, 실습등 모든 내용이 담겨있는 바이블 책입니다. 

 

​이번 책은 기존의 코드를 새로운 버전으로 수정 되었으며 당연히 책 두께도 늘어다고 책도 1권, 2권으로 나뉘어 볼 수 있는 분권 구조로 되어 있습니다. 책을 분권할 수 있어서 가지고 다니며 읽기가 좀 편해 진건 같습니다. 그래도 상당히 방대한 내용을 담고 있는 책입니다.  그리고 책이 칼러로 구성되어 있어서 그림 및 설명을 보기가 편합니다. 그래프, 이미지 등이 칼러로 구성되어 있더 좀더 편하게 학습을 할 수 있도록 되어 있습니다. 

 

1판, 2판, 3판 까지 책을 가지고 있다면 "핸즈온 머신러닝 3판" 책의 구성 부분에서 변경사항을 확인할 수 있습니다.

새롭게 바뀐 부분(업데이트 내용)을 확인하면서 "핸즈온 머신러닝 3판" 책을 읽어 보았는데

 

1. 최신 라이브러리 버전으로 전체 코드 업데이트 

책의 소스 코드를 PyCharm에서 Jupyter 로 코딩하면서 실습을 해 보았습니다. 

소스 코드가 책의 분량만큰 양이 많은데 관련 소스코드가 GitHub에 등록되어 있어서 해당 부분을 책과 참고하여 공부하여 빠르게 학습을 할 수 있었습니다. 

각 소스코드는 기술의 중요핵심을 설명하고 있으며 책에서는 코드 하나하나를 상세히 설명하고 있어서 공부하는데 많은 도움이 되었습니다. 

 

2. 상세한 모델선택 가이드라인

책 전반에 그림과 모델 설명 그리고 유용한 방법등이 이론적으로 잘 설명되어 있고 읽기 편하게 되어 있습니다.  공부를 한후에 필요에 따라 책의 목차를 참고하거나 모델을 선택하여 결과를 확인할 수 있을것 같습니다. 

 

3. 사이킷런과 케라스 새로운 기능 

4. 케라스 튜너 라이브러리, 허깅 페이스의 트랜스포머스 라이브러리

1판,  2판에 없던 내용의 추가 되었습니다.  해당 내용의 추가로 책이 더욱 좋아진것 같습니다.  

 

5. 스테이블 디퓨전을 비롯한 컴퓨터 비전, 자연어 처리 분야의 최신 트렌드와 구현 

아직 상세히 공부는 못했지만 컴퓨터 비전과 자연어 처리 분야의 기술과 용어 설명 구현 방법을 확인할 수 있었습니다.  해당 내용은 요즘 가장 이슈인 부분으로 전체적인 흐름 및 기술을 확인할 수 있었습니다

 

"핸즈온 머신러닝 3판" 의 가장 큰 장점은 머신러닝, 신경망, 딥러닝의 전반적인 기술을 확인할 수 있는게 가장 큰 장점이라고 생각합니다.  각각의 기술을 전개해놓고 해당 기술에 대한 설명 및 상세 내용으로 책이 구성되어 있어 전반적인 머신러닝, 신경망, 딥러닝이 무엇이지 그리고 어떤 기술을 활용해야 하는지 해당 기술의 요점 및 소스를 활용하여 어떤 결과를 낼 수 있는지 정확히 할 수 있습니다. 모델 선택 가이드 라인 또한 공부하는데 많은 도움이 될 수 있습니다.  속도 , 사양등을 확인하면서 어떤것을 선택해야할지 기준으로 많은 도움이 됩니다. 

 

전반적으로 "핸드온 머신러닝 3판"은 2판에서 3판으로 분량이 늘어났으며 소스코드 업그레이드 및 새로운 기술 추가로 인공지능, 신경망, 딥러닝의 모든 것을 담고 있는 베스트셀러 책입니다. 

책의 모든 부분을 읽어 보지는 못했지만 전반적으로 많은 부분이 바뀌고 새로운 기술이 등장하는것을 확인할 수 있는 책이었습니다. 

 

다른 머신러닝, 신경망, 딥러닝 책도 많지만 "핸드온 머신러닝 3판"은 꼭 읽어봐야 한다고 생각합니다.  머신러닝, 신경망, 딥러닝, 인공지능 하는 모든 분들께 추천합니다. 

 

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

 

 

KakaoTalk_Photo_2023-10-29-23-42-42 001.jpeg

 

 

나처럼 머신러닝에 대해 전혀 모르는 사람이 읽기에는 이 책은 내용도 많고 쉽지 않았다.

 

내가 궁금했던 내용은 1권에 대부분 들어있어서 1권 위주로 읽었다. 1권만 읽어도 인풋의 양이 만만치 않다. 한달안에 모든 내용을 다 읽고 실습하고 이해하는 것 까지는 어려운 것 같다. 

 

나는 실습은 거의 넘겼고 머신러닝에서 어떤 분야가 어느 때에 사용되는지, 어떤 방식으로 사용되는지 알고 싶어서 그냥 쭉 읽어나갔다. 다음에 기회가 되면 필요한 내용들에 대해서는 실습도 하면서 익혀볼 예정이다.

 

2권은 아직 손도 못댔다. 시간이 되는대로, 흥미가 가는대로 천천히 읽어볼 예정이다.

 

 

KakaoTalk_Photo_2023-10-29-23-42-42 002.jpeg

 

 

 

읽고 나니 정말 이 책이 인공지능의 바이블이라고 불리는 이유를 알 것 같다. 1판, 2판도 두꺼웠지만 3판은 쪽수가 더 늘어나 천 페이지를 넘게 되었다. 물론 분권되어 있어 읽기는 편하지만 압도적인 두께이다.

  • 1부에서는 머신러닝의 개념을 소개 하는 파트로 기본적인 머신러닝의 개념, 학습방법( 분류 / 모델훈련 / 서포트 벡터 머신 / 결정 트리 / 앙상블학습과 랜덤 포레스트 / 차원 축소 / 비지도 학습)에 대해서학습을 할 수 있고
  • 2부에서는 신경망과 딥러닝의 학습 할 수 있다 특히 12장의 텐서플로의 구조 및 사용법, 타입변환/변수/다른 데이터구조, 사용자 정의, 주로 사용하는 함수에 대해서 설명하고 13장의 대용량 데이터셋에대한 멀티스레드와 큐를 사용하여, 여러 파일에서 동시에 읽고, 샘플을 셔플링하거나 배치로 만드는 등의 작업을 수행하는 것을 학습 할 수 있어서 좋았다.

머신러닝을 시작하거나 다시 한번 기본을 다지고 싶은 분들, 현업에서 일하는 분들 모두에게 추천하고 싶은 서적이다.

 유클리드의 유명한 말 "기하학에는 왕도가 없다"처럼 최근 박해선님의 "머신러닝, 딥러닝은 어떻게 공부할 것인가?" 강연에서도 마찬가지로 머신러닝에는 왕도가 없다라고 말씀한 것이 기억난다.

 

그럼에도 우리는 머신러닝의 지름길을 찾으려고 노력한다. 그러다가 엄청난 수학기호에 좌절하고 다시 공부하기를 무한 반복한다. 물론 수학적인 지식 없이는 머신러닝을 이해하기 힘들겠지만, 시작할 때는 분명 없어도 된다. 그 시간에 머신러닝의 기본 개념, 분야별 머신러닝 훈련, 데이터 분석, 전처리, 파이썬과 라이브러리(맷플롯립, 판다스, 넘파이, 사이킷런, 케라스, 텐서플로, ...), 코랩, 허깅 페이스, GPU 사용시 주의사항, 서비스, 컴플라이언스, MLOps, 엣지AI(모바일, 임베디드)등 다뤄야 할 주제가 너무 많다.

 

그런데, 이 모든 것을 한권(?)에 담은 책이 있는데, 그것이 바로 핸즈온 머신러닝(3판)이다.

책의 구성은 2권 합본으로 부록을 제외하더라도 914페이지나 되는 엄청난 분량이다. 엄청난 분량인데도, 요약해서 설명하고 있다는 느낌이 드는 것은 머신러닝 분야가 원래 방대할 뿐만아니라 발전속도가 대단히 빠르기 때문이다.

 

시중에 다른 책들의 구성을 살펴보면, 트랜스포머 모델이나 강화학습을 소개 정도로 하거나 포함되지 않는 경우가 있는데, 핸즈온 머신러닝은 트랜스포머, 비전 트랜스포머, 허깅페이스 라이브러리, 오토인코더, GAN, 확산모델(스테이블 디뷰전), 강화학습 최신 트렌드, 엣지AI(Tensorflow.js), 모델 배포까지 빼놓지 않고 모두 다루고 있다.

 

물론, 초급을 위한 책은 아니다. 파이썬과 머신 러닝의 기본 개념을 익혔다면, 다음 읽을 책으로 주저없이 추천한다.

최신 버전의 라이브러리 사용법과 분야별 최신 트렌드를 한꺼번에 모두 공부할 수 있다.

추가로 관심있는 부분은 대수학, 머신러닝, XGBoost, 신경망(딥러닝), 컴퓨터 비전, 트랜스포머, 자연어 처리, 강화학습, MLOps를 주제로 하는 각각의 책으로 심화학습하면 될 것이다.

 

저자의 소스코드도 훌륭하지만, 친절하고 자세하게 한글로 설명하는 역자의 소스코드는 꼭 챙겨서 손코딩해보기를 바란다. 또한 책 중간중간 역자의 경험에서 나오는 라이브러리 사용 기법과 학습 팁(비용함수/활성화함수/하이퍼파라미터 초기값 및 설정)들도 감동을 줄 것이다.

이해하기 어려운 부분은 오픈채팅이나 최근 디스코드에서 질문하면 바로 응답을 주는 것도 큰 이득이다.

 

개인적으로 책에서 좋았던 부분은 각 장의 마지막에 있는 연습문제인데, 보통 책을 모두 읽더라도 금새 잊어버릴 경우가 있는데, 핵심 개념을 문제로 다시 한번 각인할 수 있는 효과가 있었다. 물론 부록에 정답도 자세히 있다. ㅎㅎ

그리고 19장의 대규모 텐서플로 모델 훈련과 배포 방법에서 모델을 서비스하는 방법이다.

부록 2장의 머신러닝 프로젝트 체크리스트도 잊지말고 챙겨보길 바란다.

 

마지막으로 저자의 머신러닝 공부의 왕도로 끝맺고자 한다.

 

필자가 여러분께 전하고 싶은 조언은 연습하고 또 연습하라는 것이다. 모든 연습문제를 풀어보고, 주피터 노트북을 실행해보고, 캐글에 가입해보세요, 머신러닝 커뮤니티에 가입하고 강좌를 듣고, 논문을 읽고, 콘퍼런스에 참관하고, 전문가와 만나보세요

 

"한빛미디어<나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

 

 

머신러닝은 관심이 많은 영역으로 개발자로 살아가면서 조금씩 학습하고 있다..
 
도서의 분량은 두권으로 분리 될 정도로 많지만 머신러닝을 학습하고자 하는 님들에게 필요한 것들로 두권을 한달 가까이 정독을 하였다, 모든 예제를 실습하면서 읽었으면 하는 아쉬움이 남는다. 학습 하는 님들의 편의를 위해서 두권으로 나눈 것이 지하철에서 이동 하면서 읽기에 좋았다.
 
데이터 과학을 공부하지 않는 친구들에게 어려운 책이지만 기초 설명, 수학 이론, 실습, 예제를 통해서 접근 하고 있어서 수학 이론에 약한 나에게 수학 이론을 찾아 볼 수 있게 하여.좋았다.
 
1부에서는 머신러닝의 개념을 소개 하는 파트로 기본적인 머신러닝의 개념, 학습방법( 분류 / 모델훈련 / 서포트 벡터 머신 / 결정 트리 / 앙상블학습과 랜덤 포레스트 / 차원 축소 / 비지도 학습)에 대해서학습을소할 수 있고 2부에서는 신경망과 딥러닝의 학습 할 수 있다 특히 12장의 텐서플로의 구조 및 사용법, 타입변환/변수/다른 데이터구조, 사용자 정의, 주로 사용하는 함수에 대해서 설명하고 13장의 대용량 데이터셋에대한 멀티스레드와 큐를 사용하여, 여러 파일에서 동시에 읽고, 샘플을 셔플링하거나 배치로 만드는 등의 작업을 수행하는 것을 학습 할 수 있어서 좋았다.
 
파이션, 데이터 과학을 학습 한 친구들이 머신러닝을 학습 할 수 있는 교과서로 님들에게 추천 합니다.
 
한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다

AI 분야에서 단 한 권의 책만 읽을 수 있다면 주저없이 꼽고 싶은 명작. 드디어 3판 개정판이 발간되었다.

이 책은 참 묘한 책이다. 전체적으로 난이도가 높은 편임에도 부분 부분 읽다보면 의외로 읽기가 편하고 이해가 잘 되는 편이다.

엄밀한 수학적 정의를 다룬다든가 대부분의 논문 이해에 무리가 없을 수준의 깊이가 담겨있는 것은 아니지만 AI 진영에 두루 쓰이는 기술이 체계적으로 망라되어있다. 이 분야를 과학과 공학으로 나눈다면 과학보다는 공학 중심적인 내용을 담고 있다.

과학도 상당 부분 담겨있지만 과정의 도출보다는 결론을 깔끔하게 정리하는 식으로 기술되어있으며 이를 구현해 내는 것과 응용하는 데 보다 많은 도움을 주는 책이다.

따라서 이 분야의 기술을 숲을 보는 시각으로 두루 섭렵한다든가 프로그래밍 능력이 뛰어난 개발자가 AI 진영의 기술을 담은 서비스를 구현하는 데 많은 도움을 받을 수 있다. 물론 연구 진영에서도 AI분야의 비교적 최신 이론을 빠르게 정리하고 연구의 방향성을 잡는 데에도 큰 도움이 될 것이다.

이 책에는 1000페이지가 넘는 방대한 분량이 수록되어있음에도 어느 정도의 통계학적 혹은 데이터 관련 지식 - 예를 들면 그림으로 배우는 StatQuest 머신러닝 강의 책에 담긴 내용을 잘 숙지하는 정도-을 습득하고 있고, Python 중급 이상의 프로그래밍 실력을 갖춘 독자라면 긴 AI의 여정을 이 책으로 시작할 것을 권하고 싶다.

무언가를 골똘히 연구할 때나 고민하거나 혹은 문제해결을 위해 고심하고 있을 때 우리는 보통 마인드 맵과 같은 도구를 통해 생각을 정리하고 방향성을 잡는다.

이 책은 그런 마인드 맵에서 첫 출발 지점 동그라미의 위치로 적합한 책이다. 책 한 권으로 AI 진영의 폭넓은 지식을 한 눈에 파악하기에는 이 책보다 뛰어난 책이 없다고 생각한다. 방대한 내용을 담아내고 있음에도 하나하나의 주제는 매우 친절하고 자세하게 수록되어있고 직관적인 시각화를 통해 개념을 깊이있게 이해할 수 있도록 도와준다.

우선 머신러닝 서비스의 전반을 이해하는데에는 이 책의 1~2장 만으로도 충분하다. 2장의 실습을 진행하며 예측을 위한 머신러닝 모델을 어떤식으로 만들어나가는지 감을 잡는다면 뒤에 이어질 내용을 익혀 특정 데이터, 도메인, 기술, 아이디어, 문제에 심화 적용하기만 하면 되는 셈이다.주택가격예측

실리콘 밸리의 주택 가격을 예측하는 모델 하나를 만들어보는 과정으로 AI 진영에서 활용되는 기술 전반을 이해하기에 부족함이 없다. 더욱이 더 깊이있는 수준의 지식을 습득하는데 상당한 지적 호기심을 제공하여 향후 학습의 강력한 동기부여로 작용하기도 한다. 단 두개 챕터에 수록된 내용이지만 능히 한 권의 책을 낼 수 있을 정도의 분량이기도 하다.

이 책은 출판사의 배려로 3판부터는 2권의 책으로 나뉜다. 1권은 주로 머신러닝 내용을 다루고 있으며 케라스를 활용하여 간단한 딥러닝을 맛볼 수 있다. 머신러닝 대부분의 지식과 기술은 딥러닝에도 요긴하게 활용되므로 2권을 읽기 전에 충분히 개념을 학습해 두면 좋다.

이번 개정판에는 사이킷런에 추가된 새로운 기능들과 최신 라이브러리가 수록되었지만 1권에 해당하는 머신러닝 진영의 기술은 딥러닝에 비해 훨씬 오랜 기간 연구되었고 변화가 딥러닝 분야에 비해 적기 때문에 2판에 비해 크게 달라진 사항은 없다.

하지만 기술 측면에서 불필요하고 중요하지 않은 내용들이 많이 삭제되어 보다 집중력있게 핵심을 이해하는 데 도움을 주는 방향으로 편집된 것 같고 의외로 실무적으로 중요한 요긴한 팁들이 생략된 경우가 더러 있었는 데 그런 부분들이 알차게 보완된 느낌이다.

2판에서 계속 이어지는 기조 중에 정말 마음에 드는 것은 개인적으로 쉬운 내용 기술과 더불어 애매한 개념을 눈으로 보이게 하는 시각적 자료의 활용이 인상적이다.

예를 들면 3장에서 다루는 오차 행렬의 시각화는 볼 때마다 놀랍다. 2차원적인 동적 기억을 필요로하는 개념이라 보는 순간에는 이해가 되어도 기억이 휘발되고 나면 다시 깊이있는 통찰로 로딩하는데 제법 시간이 걸리는 이상한 지식 구조이다. (마치 법률 분야의 if에 따른 리걸 마인드 기억 구조와도 유사하다.)

어떤 책은 예측과 실제의 축을 거꾸로 명시해 많은 혼동을 주는가 하면 오차 행렬 혹은 혼동 행렬이라는 용어 답게 저자들도 혼동된 것인지 오류로 기술된 책들도 은근 많다. 반면 본 도서에는 이 오차 행렬표 내부에 숫자 그림이 들어가 있어 예시를 활용한 명쾌한 이해 및 개념을 잡는 데 도움을 주고 있어 저자의 전달력과 깊이 있는 인사이트에 여러번 감탄했다.오차행렬

이런 장치는 책을 읽는 내내 여러번 경험할 수 있다. 아래 그림은 경사하강법의 여러 방식을 적용하며 실제 파라미터 공간에 표시된 경로를 시각화 한 것인데 예제를 실습하며 직접 구현해보려고 노력하다보면 말로는 전달하는 데 한계가 있는 경사하강법의 움직임을 눈으로 확인하고 직관적으로 이해하는 데 많은 도움을 받을 수 있다.경사하강법
규제

소프트맥스 회귀나 결정트리 등 알고리즘 설명 파트도 마찬가지이다. 대충 그렇다는 말 보다는 확실히 그림으로 경계선을 확인하고 파라미터 변수의 조정으로 달라지는 경계선을 눈으로 확인하는 것이 이 알고리즘을 확실하게 이해하는데 큰 도움이 된다.소프트맥스
결정트리
k-mean

하다 못해 통계의 가장 기초적인 성절인 대수의 법칙(큰수의 법칙)이나 차원의 저주도 눈으로 보여준다. 방대한 분량의 쉽지 않은 책을 때로는 매우 쉽게 만들어주는 묘한 장치들이다.큰수의법칙
차원의저주

책에 수록된 코드를 실습하기 쉽게 안배하고 있는 점도 이 책의 뛰어난 장점 중 하나이다. 말로 설명하는 것 이상으로 실제 구현하고 눈으로 확인할 수 있게 도와주는 방식이 매력적이다. 이 책의 역자는 저자의 배려를 한층 업그레이드 하여 더욱 편리하게 실습할 수 있도록 도와주고 있어 인상적이었다. 역자의 깃허브로 들어가 Open in Colab 버튼만 누르면 되니 어지간히 게으른 독자도 실습 핑계를 대긴 어려운 구조이다.깃허브
텐서보드

2권부터는 딥러닝의 여정을 떠난다. 보다 저수준의 텐서플로 API를 활용하는 예제들이 등장한다.텐서플로

특히 CNN, RNN, LSTM의 기본 3모델에서 더욱 확장된 ResNeXt, CSPNet과 같은 다양한 신형 모델들이 등장한다. 이는 이 책의 또 하나의 매력이기도 하다. 개정판이 나올 때마다 비교적 최신의 선풍적인 인기를 끌었던 새로운 모델들과 기술들이 소개되고 있어 개인적으로 매우 유익했다.

가진 레거시 환경의 변화 대비 AI 진영의 SOTA 지식들은 차고 넘쳐 이젠 따라갈 수 없는 지경에 이르렀다. 가진 역량의 한계로 소소한 변화는 더이상 추적할 수 없게 되었고 집중하는 분야의 SOTA를 파악하고 시스템에 반영하는 것도 무리수였는데 이 책 덕분에 그간 잃어버린 고리, 미씽 링크를 연결할 수 있어 저자에게 많은 감사를 느낀다.

그러면서도 내용은 더욱 풍부해졌다. RNN 모델을 다룰때도 전통적인 통계 진영의 시계열 모델링도 다루고 있어 비교 대조하면서 관련 지식의 깊이를 풍부하게 만드는 데 도움이 되었다.

ARIMA 모델은 전통적으로 오랜 기간 동안 그리고 지금까지도 잘 쓰이는 모델인데 딥러닝 도서 대부분에는 이 부분이 생략되어있어 양 진영의 시너지를 활용하기 부족함이 많았는데 이번 개정판에는 그런 부분도 신경쓰고 있어 더욱 알차게 구성되었다는 느낌을 받을 수 있었다.ARIMA

한편 이번 개정 3판의 백미는 역시 딥러닝 파트의 커다란 변화인데 허깅페이스의 트랜스포머스 라이브러리나 잡음 제거 확산 확률 모델 DDPM 등 2020년 이후 굵직한 변화를 추적하기에 좋다.트랜스포머스
DDPM

3판이나 개정되면서 1권 영역은 성숙도가 높아졌으니 다음번에는 딥러닝 위주의 2권에 대한 개정판만 나와도 좋겠다는 생각도 든다.

방대한 내용을 한정된 리뷰로 모두 담아내는 것은 보통 무리가 아니었다. 처음엔 챕터별로 다른 책에서 익히기 힘든 내용들을 본 도서는 어떻게 기술하는지에 중점을 두고 리뷰를 작성했다가 폭발하는 분량이 감당이 안되어서 다시 줄여 썼는데 이러니 또 책이 가진 모든 장점을 잘 보여주지 못해서 안타깝다.

개인적으로 2판의 베타리딩에 참여하였기에 더욱 정이 가는 책이고, 이번 3판 역시 참여의 기회가 있었으나 개인적인 좋지 못한 사정으로 인해 참여하지 못해 많이 아쉬웠던 책이기도 하다. 그만큼 더 알찬 리뷰를 정리하고 싶었는데 방대한 규모와 책의 수준이 뛰어나 수준에 걸맞는 리뷰 작성에는 한계가 있다.

하지만 분명한 사실은 AI 분야의 관련 기술을 한 권의 책으로 이 보다 폭넓게 파악하고 가진 레거시에 적용하는데 있어 이보다 도움되는 책은 없을거라 확신한다. 관련 분야의 도서를 벌써 300권은 넘게 읽은 것 같은데 이 만한 책을 찾지 못했기에 더욱 확신한다.



 

ML/DL 필독서인 핸즈온 머신러닝의 3판이 나왔습니다.

그 동안 책이 크고 무거워서 가지고 다니기 어려웠는데, 이번 3판은 두 개로 나눠져 있어서 가지고 다니기 매우 편해졌습니다.

이 책은 글로벌 베스트셀러인 만큼 내용은 더할 나위 없이 훌륭하며, 박해선님의 세심한 번역 및 추가 설명들도 매우 훌륭합니다.

해당 분야가 빠르게 변화하고 있는 만큼 3판에서는 추가/변경된 내용들이 잘 반영되어 있습니다.

책에 있는 실습을 따라하면서 자신의 깃허브 레포에도 올려놓으면 언제든지 참고할 수 있는 좋은 레퍼런스가 될 것입니다.

머신러닝을 학습하려고 하시는 분들은 무조건 보셔야 하는 도서라고 생각합니다.

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

머신러닝 관련 업무를 처음으로 맡았을 때 2판으로 공부를 시작했었던 기억이 있어서 3판도 기대감을 갖고 읽어봤습니다. 

 

2판의 대부분의 내용이 그대로 있으면서 3판에서는 새로운 라이브러리 사용법과 NLP, 이미지처리, 생성형AI 관련된 딥러닝 최신 트렌드에 대해 업데이트가 되었습니다. 그 중 두가지 모델이 제 관심을 끌었습니다.

 

DistillBERT

사전 학습된 BERT모델에 단점인 제한된 리소스로 모델을 실행하기 어려운 점을 더 작고 빠른 BERT모델로 만들었습니다. 한국어로 번역하면 증류 BERT모델이라 불리는 이것은 사전 학습된 대형 BERT 모델을 선생님이라 생각하고 그곳에서 나온 지식을 학생에게 가르치는 느낌으로 지식을 이전하여 소형BERT모델을 만드는 방법입니다. 이로써 모델은 대형 BERT 모델에 비해 60% 속도향상, 40% 메모리 축소하였고 성능치는 97%수준으로 유지할 수 있습니다.

 

Vision Transformer

이미지 데이터를 N*N 작은 정사각형 모양으로 나눠 각각의 정사각형에 위치,순서정보를 기억하여 마치 텍스트의 시퀀스처럼 취급하며 사용하는 트랜스포머 모델입니다. 이 모델로 이미지의 문맥, 예를 들어 하늘에 떠 있는 비행기 사진을 보고 '비행기' 라고 검출하는 것이 아닌 '하늘에서 운행중인 비행기'라는 결과를 얻을 수 있습니다.

Hands-on Machine Learning.jpg

 

머신러닝을 잘 아는 선배에게 수업을 듣는 느낌입니다.

쿡 찌르면 와르르 쏟아져 나오는 얘기 보따리 같다고나 할까요.

 

문제가 있다면 알려주는 선배와 듣는 후배 사이 간격이 제각각 일 수 있다는 점입니다.

알아도 너무 잘 알고 많이 알다 보니, 아낌없이 풀어놓는 내용들이 어떤 이에게는 전체 흐름과 윤곽을 잡을 수 있는 더할 나위 없는 기회가 될 수 있으며, 다른 어떤 이에게는 우와우와~ 하며 새로운 세상을 만나 감탄사만 연발하며 어리둥절할 수 있습니다.

더하여 옮긴이가 꼼꼼하게 추가해 놓은 주석은 뭔가 갸우뚱할 수 있는 부분이나 설명이 부족한 부분을 명확하게 짚어줍니다.

우선 무슨 얘기를 하고 있는지 알아보기로 했습니다. 하나씩 꼼꼼히 따라가려 했다가는 얼마 못 가 바스러지고 있는 제 의지를 만날게 틀림없기 때문입니다.

 

머신러닝으로 시작

기계를 학습시킨다는 어찌 보면 생소한 얘기를 풀어나갑니다. 기계를 작동시키는 건 익숙하지만 기계를 학습시킨다는 건 이상합니다.

학습이라는 사람이 이해하기 쉬운 용어를 사용하긴 하지만, 풀어서 말하면 문제를 파악하여 모델을 만들고 데이터를 이용하여 훈련시킵니다. 정해진 규칙이 아니라 데이터와 훈련으로 규칙을 찾습니다.

배우고 익힌다는 면에서 학습으로 볼 수 있지 않을까요.

수학 공식처럼 정확한 게 아니고 어느 정도 근사치면 허용하는 확률입니다.

조금 거칠게 말하면 엄청난 계산이 가능해진 기계 성능 덕분에 할 수 있는 접근 방식입니다.

훈련을 통해 처리할 수 있는 많은 부분은 딥러닝이 아닌 머신러닝만으로도 충분하다고 알려줍니다.

 

아웃풋을 요구

각 장을 마치면 연습문제가 있습니다. 내용을 다시 살펴보게 하고 이해했는지 물어봅니다.

그려보고, 만들어보고, 답을 찾고, 설명해 보라고 합니다.

만약 연습문제만 있었다면 막막할 수 있었겠지만 부록에 정답이 있습니다.

정답으로 내용을 이해한다기보다 비교하고 검토할 기준으로 삼으면 될 듯합니다.

아웃풋을 만들며 적어도 그 장에서 놓치지 말아야 할 부분을 정리할 수 있습니다.

 

텐서플로로 풀다

딥러닝을 통해 만날 수 있는 대표적인 분야를 알려줍니다.

컴퓨터 비전, 시퀀스 처리, 자연어 처리, 강화 학습

텐서플로를 이용하여 어떻게 풀어나가는지 보여줍니다.

한 번에 이해한다면 좋겠지만, 직접 돌려가며 많이 부딪쳐 봐야 감이 잡힐 것 같습니다.

모든 길을 로마로 통하는 것처럼 모든 딥러닝은 텐서플로로 통하는 것처럼 보입니다.

 

 

신경망을 이해하는데 진입장벽이 존재한다고 생각합니다.

수학 지식, 프로세스 자체에서 느끼는 이질감 등 사람마다 다양할 것입니다.

아마 한 번만 신경망이 가진 몇 가지 급소를 이해한다면 그다음은 일사천리일 것 같습니다.

'핸즈온 머신러닝'이 옆에 두고 수시로 도움 받을 수 있는 든든한 조력자가 아닐까요.

 

 

"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."

"핸즈온 머신러닝(3판)"은 인공지능의 세계로의 여정을 시작하는 이들에게 길잡이가 되어줄 필수 가이드북이다. 이 책은 단순한 이론 서술을 넘어, 독자들이 실제 상황에서 머신러닝을 적용할 수 있는 방법을 상세하고 친절하게 안내한다. 오렐리앙 제롱의 저술 방식은 교육적이면서도 실용적이며, 이를 통해 독자들은 기초적인 개념에서부터 복잡한 주제에 이르기까지 체계적으로 이해를 넓혀갈 수 있다. 또한, 박해선님의 통찰력 있는 번역은 이해도를 한층 높여준다.

이 서적은 구성이 체계적이다. 첫 번째 부분은 머신러닝의 기본을 다루며, 다양한 알고리즘과 전통적인 기법, 그리고 사이킷런을 사용한 실질적인 접근 방식에 초점을 맞춘다. 반면, 두 번째 부분은 심화된 내용으로, 딥러닝과 신경망을 중점적으로 다루며, 텐서플로와 케라스를 활용한 실제 적용 사례를 통해 독자들이 직접 경험할 수 있도록 구성되어 있다.