'2015/07/26 글 목록

분산처리 과제를 하다보니까 음악과 관련한 데이터 처리에 관한 내용이 있었는데, 관련 dataset을 공유해보고자 한다. Columbia 대학에 있는 LabROSA라는 데서 만든 음악 정보와 관련한 Dataset이다. 여기에는 음악과 관련한 metadata나 audio feature 같은게 포함되어 있고, 실제 과제에서 사용하는 Dataset은 10000개 정도의 음악 샘플을 가지고 학습을 할 것이다. 사실 이 10000개라는 정보량이 이 Dataset에서 제공하는 정보량의 약 1%에 해당하는 분량이다. 그러니 실제 우리가 직접 다룰 수 있는 건 대략 백만여개 정도의 곡이 되는 것이다. 이런 걸 어떻게 써먹을까? 우리 주변에도 음원 서비스를 제공하는 업체들이 여러군데 있다. 보통 그런데 들어가면 사용자에게..

Study/AI 2015. 7. 26. 14:45

[Daily] 그냥 문득....

5월부터 2달동안 회사에서 진행하는 소프트웨어 교육을 받았다. 항상 가지고 있던 생각이, 코딩도 모르면 인터넷보고 찾아보면서 직접 해보고, 응용하면 되겠지 라는 막연함이었는데, 그걸 교육 들으면서 잘못된 생각이라는 걸 많이 느꼈다. 모르면.... 인터넷보고 찾아보는 걸로 끝이 아니라 공부를 해야 한다고 말이다. 만약 제한된 환경에서 개발 프로젝트가 주어졌을 때, 너무 많이 주어진 정보속에서 안심하고 있다가는 그냥 모른 체로 남고 스스로 발전하지 않게 된다. 설령 그 목표를 달성했어도 말이다. 나는 너무 운이 좋아서 그런 난관을 겪지도 않고, 막상 그런 경험을 했을 때 너무 당황해서 아무것도 못했다. 그냥 스스로가 너무 자만했던 것 같다. 앞으로 스스로 시간좀 내고 정말 스스로 익히는 공부, 누가 떠먹이고..

Me 2015. 7. 26. 00:46

[Big Data] Data Cleaning & Integration

전에도 잠깐 이야기했었는데, 요즘 MIT에서 하는 Tackling the Challenges of Big Data 라는 과목을 듣고 있다. 비싼돈 주고 듣는 수업이라서 나름 준비도 하고, 녹화도 해가면서 모르는 내용은 다시 보고 있는데, 생각보다 빅데이터에 관한 포괄적인 개론을 다루고 있어서 많은 걸 배우고 있다. 어떤 글에서도 봤는데, 사람들 사이에서 아직도 빅데이터나 사물인터넷에 대한 개념이 아직까지는 뚜렷하지 않은 듯하고, 나역시 정확히 뭐다 라고 정의하기는 참 힘든 부분이 있었는데, 그래도 이 강의를 들어보니까, 빅데이터와 관련해서 어떤 연구가 진행되고 있고, 어떤 기법들이 사용되고 있는지에 대해서 대충 가늠할 수 있는 듯 했다. 그 중 한 내용을 잠깐 요약을 해보고자 한다. 지금 듣고 있는 강의..

Study/AI 2015. 7. 26. 00:21

이전 1 다음

이전 다음

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

chans_jupyter

TAG more

« 2015/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

글 보관함

자신에 대한 고찰

티스토리툴바