[RL] Fully Observable와 Partially observable의 차이
강화학습을 다루다보면 근본적으로 environment의 특성에 대해서 이해할 필요가 있다. 그 중에서도 많이 나오는 내용이 해당 env가 Fully Observable 이냐 Partially Observable이냐 를 정의하는 것이다. 우선 Observability라는 개념은 Dynamic Control System 이론에서 나온 개념인데, 위키피디아에 정의된 내용을 그대로 가져오면, 시스템의 내부 상태가 외부 출력에 대한 지식으로부터 얼마나 잘 추론될 수 있는지에 대한 척도를 말한다. 다시 말해서 출력만 가지고 시스템 상태를 파악할 수 있느냐를 나타내는 것이다. Fully Observable이라는 말은 출력된 결과만 가지고도 내부 state를 모두 추론할 수 있는 것을 의미한다. 강화학습 notatio..
Study/AI
2018. 10. 22. 13:57
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- SketchFlow
- dynamic programming
- ColorStream
- Gan
- TensorFlow Lite
- reward
- Kinect SDK
- Windows Phone 7
- Policy Gradient
- 파이썬
- windows 8
- 딥러닝
- bias
- Expression Blend 4
- Offline RL
- 강화학습
- 한빛미디어
- DepthStream
- RL
- Off-policy
- Kinect
- PowerPoint
- Variance
- arduino
- ai
- End-To-End
- processing
- Kinect for windows
- Distribution
- Pipeline
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
글 보관함