[RL] Fully Observable와 Partially observable의 차이
강화학습을 다루다보면 근본적으로 environment의 특성에 대해서 이해할 필요가 있다. 그 중에서도 많이 나오는 내용이 해당 env가 Fully Observable 이냐 Partially Observable이냐 를 정의하는 것이다. 우선 Observability라는 개념은 Dynamic Control System 이론에서 나온 개념인데, 위키피디아에 정의된 내용을 그대로 가져오면, 시스템의 내부 상태가 외부 출력에 대한 지식으로부터 얼마나 잘 추론될 수 있는지에 대한 척도를 말한다. 다시 말해서 출력만 가지고 시스템 상태를 파악할 수 있느냐를 나타내는 것이다. Fully Observable이라는 말은 출력된 결과만 가지고도 내부 state를 모두 추론할 수 있는 것을 의미한다. 강화학습 notatio..
Study/AI
2018. 10. 22. 13:57
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- dynamic programming
- 한빛미디어
- 딥러닝
- Policy Gradient
- windows 8
- 강화학습
- ColorStream
- TensorFlow Lite
- End-To-End
- SketchFlow
- ai
- Kinect
- RL
- Distribution
- 파이썬
- Windows Phone 7
- Kinect SDK
- Offline RL
- Pipeline
- processing
- Kinect for windows
- Expression Blend 4
- Off-policy
- reward
- Gan
- bias
- DepthStream
- arduino
- PowerPoint
- Variance
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
글 보관함