티스토리 뷰

Study/AI

[MLY] 학습 곡선 분석 : 다른 케이스들

생각많은 소심남 2018. 9. 26. 13:58

 이런 학습 곡선에 대해서 고려해보자.

 이 그래프는 high bias일까. high variance일까, 아니면 두 가지 경우가 합쳐진 걸까?

 파란색 학습 오류 곡선은 상대적으로 낮고, 빨간색 개발 데이터의 오류 곡선은 파란색 학습 데이터 오류 곡선에 비해서는 더 크다. 그렇기 때문에 bias는 작고, variance는 큰 것이라고 볼수 있다. 여기서 학습 데이터를 조금 더 추가하면 개발 오류와 학습 오류 사이의 갭을 줄이는데 도움이 될 것이다.

 그럼 이번에는 이런 경우를 고려해보자.

 이번에는 학습 오류는 원하는 목표치에 비하면 더 큰 것을 알 수 있다. 그리고 개발 데이터 오류 또한 학습 데이터 오류에 비해서 더 큰 것을 알 수 있다. 그렇기 때문에 여기선 bias와 variance가 다 큰 것이라고 알 수 있다. 이제 알고리즘 단계에서 bias와 variance를 둘다 줄일 수 있는 방법을 찾아야 한다.

< 해당 포스트는 Andrew Ng의 Machine Learning Yearning 중 chapter 31. Interpreting learning curves: Other cases을 번역한 내용입니다.>

댓글