[도서 소개]
판다스의 기본 자료구조 개념부터 데이터 분석 방법까지!
[개발 환경 구축 가이드], [파이썬 속성 과정], [넘파이 속성 과정], [정규 표현식] 특별 부록 제공
판다스는 파이썬의 데이터 분석 라이브러리로 수백만 행에 대한 작업을 빠르게 수행하고 파이썬 데이터 생태계의 다른 도구와 쉽게 호환되는 장점을 가졌다. 이 책은 마블과 디즈니의 인기 영화, 포켓몬, NBA와 NFL 유명 선수, 넷플릭스 등의 데이터로 판다스 라이브러리를 활용하여 파이썬 기반의 데이터 분석 방법을 소개한다. [개발 환경 구축 가이드], [파이썬 속성 과정], [넘파이 속성 과정], [정규 표현식] 등 알찬 내용의 부록으로 판다스가 부담스러운 초급자도 이 부록을 통해 빠르게 판다스를 시작할 수 있다. 그리고 각 장이 하나의 독립적인 튜토리얼과 같이 구성되어 있어 중급자 이상은 필요한 부분만 골라 학습할 수도 있다. 마지막으로 각 장 마지막에 제공되는 코딩 챌린지를 직접 해보며 실무 경험까지 챙길 수 있다. 처음부터 끝까지 확실하게 판다스를 가이드하는 이 도서로 판다스의 진정한 고수가 되어보자!
[주요 내용]
- 데이터셋 구성, 그룹화, 병합, 분할 및 결합
- 텍스트와 시간 기반 데이터의 추세 탐색
- 정렬, 필터링, 피벗, 최적화 및 결론 도출
- 인기 영화(마블, 디즈니 등)와 NBA, NFL 유명 선수, 포켓몬 등의 데이터를 이용한 예제
- 코딩 챌린지: 각 장을 정리하는 연습 문제+해법
- [개발 환경 구축 가이드], [파이썬 속성 과정], [넘파이 속성 과정], [정규 표현식] 특별 부록 제공
[대상 독자]
- 데이터 분석가
- 데이터 엔지니어
- 데이터 분석에 관심이 많은 개발자
추천사
에리코 렌지안(idibu.com)
내가 읽은 모든 판다스 입문서 중에 이 책이 단연 최고다!
조나단 샬리(SiriusXM Media)
입문자도 따라하기 쉬운 가이드로 데이터 분석에 필요한 모든 기반을 빠르게 다지고 실습할 수 있다.
호세 아파블라자(Steadfast Networks)
이 책의 개념을 이해하고 실천하면 당신은 생산성을 높이고 전문가가 될 수 있다.
벤 맥나마라(DataGeek)
파이썬 초보자와 전문가 모두에게 도움이 되는 데이터 분석 및 데이터 과학에 필요한 필수 개
념을 담았다!
[서평]
판다스를 활용한 데이터 분석 완벽 실무 지침서
파이썬으로 데이터 분석을 한다면 반드시 사용해야 하는 머스트 해브 라이브러리, 판다스 활용법을 1부터 10까지 모두 담았습니다. 이 책을 통해 독자는 판다스의 기본 자료구조 개념부터 데이터 분석법까지 차근차근 배울 수 있습니다. 또한, 각 장 마지막에서는 [연습 문제+ 해법]으로 구성된 코딩 챌린지를 통해 확실하게 실전 감각도 쌓을 수 있습니다. 강조하고 싶은 이 도서의 또 다른 특징은 [개발 환경 구축 가이드], [파이썬 속성 과정], [넘파이 속성 과정], [정규 표현식] 특별 부록을 제공해 파이썬 입문자라도 판다스를 어렵지 않게 시작할 수 있습니다. 점차 데이터 분석의 중요도가 커지고 있는 지금, 주저 말고 판다스의 세계로 어서 오세요!
판단스 인 액션은 크게 두 부분으로 나뉘어 있으며 총 14개 장으로 구성되어 있습니다.
1장에서는 판다스로 샘플 데이터셋을 분석하여 라이브러리가 무엇을 할 수 있는지에 대한 전체적인 그림을 그려 볼 수 있는 개요를 제공 합니다.
2장에서는 정렬된 데이터 컬렉션을 저장하는 판다스 핵심 자료구조인 Series 객체를 소개합니다.
3장에서는 Series 객체를 더 깊이 있게 다룹니다. 값 정렬, 중복값 삭제, 최소값 및 최대값 추출 등 다양한 Series의 연산을 살펴봅니다.
4장에서는 2차원 데이터 테이블인 DataFrame을 소개합니다. 이전 장에서 배운 개념을 새로운 자료구조에 적용하고 데이터를 조작하는 추가 방법을 소개합니다.
5장에서는 같음, 같지 않음, 비교, 포함, 제외 등 다양한 논리 조건을 사용하여 DataFrame에서 행의 하위 집합을 필터링하는 방법을 소개합니다.
6장에서는 판다스에서 불완전한 텍스트 텍스트를 다루는 방법을 알여줍니다. 공백 제거, 대소문자 수정, 단일 열에서 여려 값 추출과 같은 문제를 해결하는 방법을 논의합니다.
7장에서는 여러 열 값을 데이터 행에 대한 단일 식별자로 결합할 수 있는 MultiIndex를 설명합니다.
8장에서는 피벗 테이블에서 데이터를 집계하고, 행 축에서 열 축으로 헤더를 이동하고, 데이터를 넓은 형식에서 좁은 형식으로 변환하는 방법을 설명합니다.
9장에서는 행을 버킷으로 그룹화하고 groupBy 객체를 사용하여 결과 컬렉션을 집계하는 방법을 탐구합니다.
10에서는 다양한 조인을 사용하여 여러 데이터셋을 단일 데이터셋으로 결합하는 방법을 안내합니다.
11장에서는 판다스에서 날짜와 시간을 다루는 방법을 소개합니다. 날짜 정렬, 기간 계산, 날짜가 월 또는 분기의 시작에 속하는지 여부를 결정하는 등의 주제를 다룹니다.
12장에서는 엑셀 및 JSON을 포함하여 추가 파일 형식을 판다스로 가져오는 방법을 설명합니다. 판다스에서 데이터를 내보내는 방법도 소개합니다.
13장은 라이브러리 설정을 구성하는 방법에 중점을 둡니다. 표시되는 행의 개수를 변경하는 방법, 부동 소수점 숫자의 정밀도를 변경하는 방법 임계값 아래로 반올림하는 방법 등을 살펴봅니다.
14장에서는 matplotlib 라이브러리를 사용한 데이터 시각화를 살펴봅니다. 판다스 데이터를 사용하여 꺾은선형 차트, 막대 그래프, 파이 차트 등을 만드는 방법을 살펴봅니다.
각 장의 내용은 이전 장의 내용을 바탕으로 작성되었습니다. 판다스를 처음 공부하는 사람이라면 목차 순서대로 공부하는 것을 추천 합니다. 판다스를 어느 정도 사용 할수 알는 사람이면 각 장의 시작 부분에서 해당 장의 실습 코드를 처음부터 작성하기 때문에 공부 하고 싶은 장부터 시작해도 코드 작성하는데 문제가 없습니다. 대부분 각 장에서 공부한 개념을 연습 할 수 있도록 마지막에 코딩 문제가 나옵니다. 코딩 연습문제를 꼭 풀어 봐야 실력을 향상할수 있기 때문에 꼭 풀어보시는걸 추천 합니다.
"한빛미디어 리뷰어 활동을 위해서 책을 제공받아 작성된 서평입니다."