티스토리 뷰

(해당 포스트에서 소개하고 있는 "파이썬 라이브러리를 활용한 데이터 분석" 책은 한빛 미디어로부터 제공받았음을 알려드립니다.)

 

파이썬 라이브러리를 활용한 데이터 분석(3판)

데이터 분석을 배우는 가장 완벽한 방법 파이썬 라이브러리 사용법부터 실제 데이터를 활용한 실습까지

hanbit.co.kr

 

10년전에 파이썬으로 데이터 분석을 해야 되겠다 싶어서 처음 봤던 책이 이 책이었다. (생각해보니까 그때 썼던 리뷰도 남아있다.) 그냥 책 제목도 직관적이어서 "이걸로 파이썬을 배우면서 데이터 분석도 할 수 있겠지..." 책 내용도 보지도 않고 그냥 샀던 책이었는데, 이 책이 어느덧 나온지 10년이 되었다. 책을 통해서 배울 수 있었던 것은 데이터 분석의 간단한 지름길을 알려준다는 점이었다. 책의 저자인 웨스 맥키니가 직접 개발한 pandas를 활용해서 이것저것 다양한 데이터 소스를 가지고 시각화도 하면서 통계적 지표도 보여준다는 점이 당시에는 너무 신기했고, 예제를 가지고 한참 살펴봤던 기억이 난다.

그 책이 이제는 3판으로 출간되어 나왔다. 동일한 주제이지만 책표지나 안에 들어있는 내용들이 개정되어서 나왔다. 처음 나왔을 때는 enthought canopy라는 ipython 기반 툴로 실습했었는데, 이제는 jupyter로 변경되었고 (관련 예제코드도 모두 jupyter notebook으로 제공하는 것 같다.) 안에 들어있는 패키지나 함수 활용법도 최신 패키지에 맞게 개정되어서 나왔다. 아무래도 내용이 개정되면서 추가된 내용이 많아지면서 지면수나 책 금액대도 조금 올라간 부분이 있긴 하지만 책이 담고 있는 내용에 비하면 아주 간소하게 느껴질 정도다. 사실 책의 내용에 대해서 아주 간단하게 언급하긴 했지만, 이 책의 가치는 10년이 지난 지금에서 더 중요성이 있다는 생각이 든다. 당시 책이 나오는 시점에서는 파이썬이나 pandas가 나오는 초창기 시점이기도 하고, 지금처럼 데이터 분석에 대한 중요성이 그렇게 부각되지 않았었다. 오히려 인공지능이 크게 발달하면서 데이터 분석 영역도 점점 넗어지면서 이 책도 역시 많은 사람들에게 활용될 여지가 그때보다는 많이 커지지 않았을까 싶다.

아무튼 이전에 소개한 pandas in action 책과 비교했을 때, 해당 책은 예제 중심의 pandas 활용법에 대해서 내용 전개가 되었다면, 이 책은 pandas를 가지고 처음부터 끝까지 할 수 있는 내용, 예를 들어서 데이터를 로딩하는 것부터 해서 데이터 분석하고 조작하는 방법에 대해서 잘 소개되어 있다. 또 마지막에는 실제 데이터분석 예제를 통해서 다양한 정보와 시각화 결과를 보여주면서 활용 방법에 대해서 전달하고 있다. 개인적으로도 책을 통해서 많이 배운 부분이기도 하고, 그런 부분을 개정판에서 다른 느낌으로 읽으면서 새롭기도 하다.

댓글