Dynamic Programming은 강화학습인가? 강화학습과 Model-based / Model-free
※해당 포스팅은 제 네이버 블로그 https://blog.naver.com/gusals1620/222488077108 에서도 확인하실 수 있습니다. 강화학습을 처음 공부할 때 Dynamic programming, TD method 등 다양한 방법론들을 배웠습니다. 처음에는 Dynamic Programming도 강화 학습의 한 종류인 것처럼 배웠는데요. 대학원에서 연구를 하며 강화학습에 대해 깊이 공부할 수록, Dynamic Programming은 과연 강화학습의 인가? 라는 의문이 들었습니다. 흔히 강화학습은 시간 순서에 따라 정의되는 문제인 Markov Decision Process(MDP)를 해결하기 위한 방법(method)이라고 하지만, 정확히 말하면 강화학습은 MDP를 해결하기 위한 method들..
AI
2021. 9. 7. 10:42