본문 바로가기
코딩/데이터분석(Pandas, ML, etc)

판다스, 데이터 분석 책 추천/파이썬으로 데이터 주무르기

by 나홀로코더 2021. 12. 8.
반응형

서론

 

최근 파이썬을 이용한 데이터 분석에 관심을 가지고 관련 키워드로 검색되는 책을 여러 권 사서 읽어보고 있는데, 그중 가장 추천할 만한 책을 지난 포스팅에서 한번 소개했었다.

 

판다스(Pandas) 교재 추천, 책 추천/파이썬 라이브러리를 활용한 데이터 분석

 

위 책은 판다스를 만드신 분이 쓴 책으로, 어찌 보면 당연히 그 내용이 매우 알차기 때문에 가장 먼저 "끝판왕"으로 추천을 했었다.

 

이번에는 필자가 읽어본 책들 중에 두 번째로 마음에 들었던 책을 소개한다.

 

솔직히 판다스를 소개한다는 책들 가운데에는 유튜브 동영상 한편 보는 게 나을 정도로 부실(?)한 책들이 많은데, 이 책은 전에 소개한 책 못지않게 유익한 책이라고 생각해, 끝판왕의 '전판왕' 정도로 소개할 수 있겠다.

 

 

책 소개

 

이 글에서 소개하려는 책은 비제이퍼블릭에서 출판한 "파이썬으로 데이터 주무르기"이다.

 

책 표지

 

저자는 로봇에 관한 연구를 하면서, 로봇과 데이터 과학에 관한 블로그(https://pinkwink.kr/)를 운영하고 계시는 민형기 박사님이다.

 

이 책을 처음 구입할 때 어떤 생각을 가지고 구입했었는지 기억이 잘 안 나는데, 이 책의 제일 앞부분 "책을 시작하며"부터 필자의 마음에 들었던 기억이 난다.

 

그중 일부를 인용하면 아래와 같다.

 

... 누구나 한 권 이상 있을 파이썬 기초 문법 책 같은 내용이 아니라, 명령의 뜻과 문법은 인터넷으로 검색할 테니, 내가 하려는 일과 흡사한 내용에서 초보를 위해 처음부터 끝까지 진행되는 과정을 보고 싶었던 겁니다. ...

 

판다스의 기본적인 사용법에 대해서는 어느 정도 파악이 된 것 같아 실전 예제를 중점적으로 다루는 책을 좀 보고 싶다고 생각하던 차에 딱 필자가 원하던 책을 찾게 된 것이다.

 

이 책은 예제 중심으로 서술되어 있고, 기초적인 명령어 하나하나를 설명하는 데에 집중하지 않으며, 책을 읽다 보면 데이터 분석에 대한 저자의 내공과 노하우를 느낄 수가 있는 책이다.

 

목차를 훑어보자. 

(목차를 일부 발췌한 것이다.)

 

1장 서울시 구별 CCTV 현황 분석
1-1 CCTV 현황과 인구 현황 데이터 구하기
1-3 pandas 기초 익히기
1-7 파이썬의 대표 시각화 도구 Matplotlib

2장 서울시 범죄 현황 분석
2-3 지도 정보를 얻을 수 있는 Google Maps
2-8 좀 더 편리한 시각화 도구 Seaborn
2-10 지도 시각화 도구 Folium

3장 시카고 샌드위치 맛집 분석
3-1. 웹 데이터를 가져오는 Beautiful Soup 익히기

4장 셀프 주유소는 정말 저렴할까
4-1 Selenium 사용하기

5장 우리나라 인구 소멸 위기 지역 분석

6장 19대 대선 결과 분석

7장 시계열 데이터를 다뤄보자
7-1. Numpy의 polyfit으로 회귀(regression) 분석하기
7-2. Prophet 모듈을 이용한 forecast 예측

8장 자연어 처리 시작하기
8-1 한글 자연어 처리 기초 - KoNLPy 및 필요 모듈의 설치

 

반응형

 

일단 각 장의 제목부터 이 책의 집필 의도가 잘 반영되어 있음을 느끼게 한다. 

 

1장부터 6장까지 실제 데이터분석 사례 중심으로 전개하면서, 데이터 획득부터 최종 분석 결과 도출까지의 과정을 모두 보여주고 있으며, 그 과정에서 pandas뿐만 아니라 googlemaps, folium 등 지도 관련 라이브러리와 시각화 라이브러리인 matplotlib, seaborn 등 다양한 라이브러리의 실제 사용 사례를 선보이고 있다.

 

분석의 대상과 분석 결과 자체가 흥미로울 뿐만 아니라 분석 과정에서 선보이는 다양한 시각화 기법이 매우 인상적인데, 특히 지도와 heatmap을 이용한 범죄 검거 비율의 시각화 결과(제2장)는 시각화가 데이터 분석 결과의 전달에 얼마나 효과적인지를 새삼 느끼게 하였다.

 

책에서 소개하는 분석 결과를 여기에 올릴 수는 없으니 책을 구매하셔서 꼭 읽어보시길 추천한다.

 

필자는 이 책을 언젠가 한두 번 정도 더 읽어볼 생각을 가지고 있고, 유사한 데이터 분석 과제를 해결해야 할 때 분명히 참조할 일이 생길 거라고 생각한다.

 

앞서 소개한 책은 판다스를 이용한 데이터 분석의 매뉴얼로, 이 책은 모범 사례집으로 여기기에 충분하다.

반응형

댓글