티스토리 뷰

Office

[Excel] Pareto Chart 만들기

생각많은 소심남 2015. 7. 29. 01:35

 파레토 법칙이라고 혹시 들어봤는지 모르겠다. 정말 다양한 분야에서 쓰이는 원칙이기도 하고, QE쪽에서 정의한 내용으로 말하자면 "20% 결과속에 80%의 오류가 있다" 정도? 쉽게 말하자면 소수의 결과속에서 오류를 찾을 수 있다면 profit 할 수 있다는게 정의다 아무튼..

 이때 많이 언급되는게 Pareto Chart 라는 것인데, 사실 이건 파레토 법칙과는 상관이 없다. 어느정도 유사성을 찾으려면 파레토법칙을 처음 정의한 Vilfredo Pareto 라는 사람이 그 법칙을 설명할 때 이 차트를 사용했다는 것일뿐이다. Pareto Chart는 그냥 단순하게 하나의 차트안에 하나의 bar chart와 또다른 line graph로 이뤄진 형태를 말하고 보통 이 line graph는 bar chart 가 나타내는 정보의 축적된 형태(cumulative)로 나타낸다. 이전에 논문쓸때 이런거 하나 만드는 법 알았으면 괜히 지면써서 여러 그래프 그릴필요가 없었는데, 생각보다 만드는 방법도 간단하다. 단순히 옵션만 변경해주면 되는건데 한번 소개해보고자 한다.

 일단 다음과 같은 데이터가 있다고 가정해보자.



그러면 column하나를 더 생성하고 축적된 값들을 계산해보면 다음과 같다.



이때 누적 분포를 따지면 E11에 있는 값을 기준으로 비율을 계산하면 되겠다. 참고로 드래그를 통한 자동완성을 할때 E11은 항상 고정되어 있는 절대값이므로 $표시를 붙여줘야 한다. 그러면 누적비율은 다음과 같이 계산할 수 있다. (100을 곱해서 계산해도 상관없다.)





우선 앞에서 말한대로 Pareto Chart를 만들기위한 정보를 쓰기 위해서 Cumulative Count는 숨기고 나머지 데이터에 대한 bar chart를 그려본다.



그러면 이제 해야될 일이 회색으로 표현된 차트를 line graph로 바꾸는 건데 의외로 간단하다. 회색 차트를 선택한 후 차트 계열 변경을 해주고 여기서 다음 것을 선택해주면 된다.



그러면 이렇게 나오게 되는데,



평소에 보던 pareto chart와는 다르게 line graph가 낮게 표현되는 것을 알 수 있다. 이건 사실 %로 나타내고 있는 데이터의 scale이 실제 데이터의 scale을 따라가고 있기 때문이다. 이때는 회색 chart의 data format을 바꿔야 한다. 



지금 이건 excel 2013을 기준으로 해서 2010에선 조금 다르게 나올지 모르겠는데 아무튼 해당 메뉴를 따라가면 기본축이냐 보조축이냐를 선택하는 항목이 있다. 이때 보조 축을 선택해준다. 그러면 그래프가 다른데서 봤던 pareto chart가 딱 나오게 된다. 여기서 축의 최대값을 수정하고 이것저것 하다보면 다음과 같은 결과를 얻을 수 있다. 



사실 이 포스트의 핵심은 하나의 차트안에 여러개의 결과를 넣을 수 있느냐하는 점이었다. 그리고 그 부분을 하기 위해서 보조축 항목을 적절히 활용하고, 여기에 해당 unit에 맞는 scale을 변경하는 점이 pareto chart를 만드는 간단한 방법이라 할 수 있겠다. sample파일도 같이 첨부해본다.

sample.xlsx


댓글