'Dynamic Programming' 태그의 글 목록

Dynamic Programming

Dynamic Programming은 강화학습인가? 강화학습과 Model-based / Model-free

2021.09.07 by 현민

Dynamic Programming은 강화학습인가? 강화학습과 Model-based / Model-free

※해당 포스팅은 제 네이버 블로그 https://blog.naver.com/gusals1620/222488077108 에서도 확인하실 수 있습니다. 강화학습을 처음 공부할 때 Dynamic programming, TD method 등 다양한 방법론들을 배웠습니다. 처음에는 Dynamic Programming도 강화 학습의 한 종류인 것처럼 배웠는데요. 대학원에서 연구를 하며 강화학습에 대해 깊이 공부할 수록, Dynamic Programming은 과연 강화학습의 인가? 라는 의문이 들었습니다. 흔히 강화학습은 시간 순서에 따라 정의되는 문제인 Markov Decision Process(MDP)를 해결하기 위한 방법(method)이라고 하지만, 정확히 말하면 강화학습은 MDP를 해결하기 위한 method들..

AI 2021. 9. 7. 10:42

이동통신 대학원생

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

Dynamic Programming

추가 정보

인기글

최신글

페이징

티스토리툴바