[Network] Nash Equilibrium 문제
요새 듣고 있는 강의중에 Network내에서의 현상을 다루는 강의가 있는데 거기서 배운 개념 중에 Nash Equilibrium 이라는 게 있다. 아마 Beautiful Mind 라는 영화를 본 사람이라면 이 사람이 어떤 사람인지 잘 알 것이다. 수업 관련 문제를 풀다가 다시 정리할 필요가 있어서 문제랑 같이 요약해본다. 위의 문제는 Nash equilibrium을 맞출 수 있는 Strategy, 즉 가장 최적의 solution을 찾는 문제이다. 각 행렬요소의 첫번째 인자가 U,M,D를 선택했을때의 가치이고, 각 행렬요소의 두번째 인자가 각각 L,M,R을 선택했을 때의 효용가치( 책에서는 payoff 라고 한다 )를 나타낸 것이다. 예를 들어서 내가 U와 L을 선택했다면 내가 U를 통해서 얻을 수 있는 ..
Study/Network
2015. 3. 2. 00:17
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- reward
- Policy Gradient
- Gan
- dynamic programming
- 딥러닝
- Kinect SDK
- 파이썬
- processing
- Offline RL
- 한빛미디어
- RL
- arduino
- Off-policy
- SketchFlow
- Pipeline
- Kinect for windows
- Variance
- DepthStream
- 강화학습
- Kinect
- ColorStream
- End-To-End
- Distribution
- TensorFlow Lite
- Expression Blend 4
- Windows Phone 7
- PowerPoint
- bias
- windows 8
- Python
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
글 보관함