티스토리 뷰

Study/AI

[MOOC] Tackling the challenges of Big data

생각많은 소심남 2015. 5. 7. 01:37

요즘 공부할게 무척 많아졌다는 생각이 든다. 물론 본업이 폰의 플랫폼에 관한 것이니까 어쩔 수 없이 시스템쪽을 계속 공부하고 있지만, 점점 big data나 cloud computing에 대한 관심과 더불어서 온라인강의에서도 그런 강의들을 많이 제공하는 것 같다.

 예를 들어서 현재 듣고 있는 강의중에 MIT에서 강의하는 Analytics Edge가 그렇다. 이 강의를 듣고 있는 사람이 있으려나 싶은데, 정말로 재미있는 주제를 통계와 기계학습과 관련해서 가르친다. 쉬운 예제로는 간단한 linear model을 만들어서 포도주의 판매량을 예측하고 이에 영향을 미치는 변수를 가려낸다던지, 조금더 고민해야 될 과제로는 2012년 미 대선에 대한 결과를 실제로 머신러닝에 접목시키고, 승부를 예측하면서 실제 결과와 비교하는 과정도 있었다. 덕분에 수업들으면서 이런것도 plot해봤다.

r에서 ggmaps를 사용해서 한건데, 과정대로 따라가는 건 어느정도 할 수 있었다. 근데 이걸 다시하라그러면... 음... 개념이 좀 어렵다. 아무튼 강의끝나고 조금 복습해보는 과정도 가져보려고 한다. 이렇게 이런 정보가 예측가능한 것은 이 예측을 받쳐주는 데이터들이 무척 많기 때문이라고 생각하고, 그게 big data가 아닐까 싶다.

 아무튼 본론으로 들어가서 요즘들어서 통계에도 관심을 가지고, 뭔가 실생활에서 써먹을만한 뭔가가 필요하지 않을까 싶어 찾다고 마침 MIT에서 이 포스트의 제목과 동일한 이름의 강의를 진행한다길래 신청해봤다.(물론 여건상 직접 가는건 안되니까 온라인으로나마 :) )


<https://mitprofessionalx.mit.edu/courses/course-v1:MITProfessionalX+6.BDx+5T2015/about>


 물론 여타 강의와는 다르게 비용부담이 조금 있다. 약 550불정도이고, 10% discount쿠폰이 있어서 대략 500불정도에 신청했다. 뭐 이런데 돈까지 쓰냐고 하는 사람들이 종종 있었는데, 개인적으로 MIT에서 제공하는 강의들 자체가 질이 너무 좋았다. 다른 강의에서 생각치도 않던 내용에 대해서 원론적으로 접근하고, 결론을 도출하는 방식으로 진행하는 방식이 많이 나오는터라 난 이정도 돈을 주고 들을만한 가치가 있다고 믿는다. 

 커리큘럼을 보니까 센서나 하드웨어에서 나오는 데이터를 수집하는 방법부터 hadoop, spark, scalable r-dbms도 같이 다뤄주는 거 같다. 사실 나도 이런 정보가 그냥 잡지나 책으로 줏어들은 내용들만 있지 이게 실제로 어떻게 쓰이는지 혹은 우리가 실제로 쓸 수 있는 방법을 어떻게 배울 수 있을까 궁금했었는데, 좋은 기회가 아닐까 싶다. 딱 남들에게 가르쳐줄 수 있을만큼만 배우고 직접 해보고 싶다. 그게 이 블로그가 될지도 혹은 오프라인이 될지도 모르겠지만...

 


얼마전에 구글 캠퍼스에서 임시 출입증도 받았다. 항상 꿈만 크긴 한데, 언젠가 기회가 진짜로 생기면 그 캠퍼스에 있는 홀에서 이런 관심사를 같이 공유할 수 있는 사람들이랑 얘기도 하면 좋을거 같단 생각을 해본다. 분명 요새 트랜드니까 이런거 잘하는 사람들도 분명히 있겠지만, 그보다도 그 관심사를 더 쉽게 배우고 싶은 사람들이 훨씬 더 많을거다. 그런 사람들을 위한 자리? 작은 소망중 하나이자 꼭 한번 해보고 싶은 목표다. 

 혹시 같이 하실 분? ㅎ

댓글