Hobby/Book

[Book] 실전 데이터 분석 with 파이썬

생각많은 소심남 2025. 2. 6. 00:18

(해당 포스트에서 소개하고 있는 "실전 데이터 분석 with 파이썬" 책은 길벗 출판사로부터 제공받았음을 알려드립니다.)

 

실전 데이터 분석 with 파이썬

 

www.gilbut.co.kr

실전 데이터 분석 with 파이썬

실생활속에서 다뤄지는 데이터의 크기나 발생빈도가 과거에 비해 커지면서, 점점 데이터 분석의 영역도 넓어지고 이에 대한 수요도 늘어가고 있다. 덕분에 시중에 출간되는 서적도 데이터 분석 관련 서적들이 많이 나오고 있어서 종종 살펴보는 편이다. 사실 데이터 분석이란 용어가 참 단순해 보여서 그렇지 현업에서 이를 수행하기 위해서는 너무나 많은 과정이 수반된다. 예를 들어서 데이터 내에 결측치가 있으면 이를 대처할 처리 방법도 고민함은 물론, 잠재된 의미를 찾고, 이를 통해서 어떤 의사소통의 수단으로 활용하기 위해서는 통계치도 뽑아볼 수 있어야 하고, 또 설득을 위한 시각화 자료도 필요하다. 그래서 대부분의 데이터 분석 책들이 그런 내용들을 다루고 있다.

이번에 소개하는 책도 역시 그런 맥락에서는 여타 같은 주제를 다룬 책들과 유사하나, 조금 전개방면에서 조금 차별성이 나타난다. 간단하게 소개하자면 책에서 다루는 실전 문제를 5가지로 부여한 후, 먼저 이를 해결하기 위해 필요한 이론적인 내용과 패키지 활용 예시를 쭉 소개한다. 해당 문제를 푸는데 필요한 지식들이 확보가 된 이후로 비로서 실전 문제를 푸는 과정으로 책이 진행된다. 그래서 어떻게 보면 다양한 관점의 독자가 바라보기 좋은 책이 될 것 같다. 예를 들어서 기본적인 지식이 부족한 사람은 처음부터 쭉 따라하면서 이론적인 내용과 예시를 직접 해보는 방법을 취할 수 있을 것이고, 어느 정도 관련 분야에 대한 지식을 가지고 있는 사람이라면 바로 실전 문제를 접하면서 필요한 내용을 앞에서 확인하면서 접근한 방법도 고려해볼 수 있겠다. 크게 책에서 다루고 있는 실전 주제는 다음과 같다.

  • 카드게임의 승리 전략 탐색
  • 온라인 광고 클릭의 유의성 평가하기
  • 뉴스 헤드라인으로 질병 발생 추적하기
  • 온라인 채용 공고로 데이터 과학자의 이력서 개선하기
  • 소셜 네트워크 데이터로 미래의 친구 관계 예측

사실 이렇게 접근하다보니 책의 분량이 조금 많아진 측면도 있긴 하지만, 원체 책에서 다루고 하는 내용의 범주가 워낙 넓기에 다양한 데이터 분석 및 머신러닝 관련 지식을 습득하고자 하는 practitioner에게는 도움이 될 듯 하다. 특히 4번째에서 다뤄지는 온라인 채용공고로 데이터 과학자의 이력서 개선하는 부분에 대한 내용은 자연어 처리와 관련되어 웹사이트에서 추출한 텍스트 기반으로 어떤 채용 공고에 대한 단어의 묶음집을 clustering하는 예시에 대해서 다루고 있는데, 최근 활용되는 생성형 AI를 쓰는 건 아니지만 이렇게 웹 상의 데이터를 활용하여 처리하는 예제는 참신하기도 하고, 꽤 유용한 느낌이 들었다.

물론 이 책에서는 최근에 핫한 생성형 AI에 관한 내용이나 딥러닝 관련 내용은 담고 있지 않다. 하지만 실제 현업에서 접할 수 있는 문제에 대해서 이렇게 pandas와 scikit-learn 같은 툴을 활용하여 해결하는 과정을 소개하는 책이기에, 관련 내용을 통해서 이론적인 내용과 실전 주제에 대한 경험을 쌓을 수 있는 좋은 기회를 제공하리라 생각한다.