몬테카를로 트리 서치 (Monte Carlo Tree Search)에 대한 정확한 정리
※해당 포스팅은 제 네이버 블로그 https://blog.naver.com/gusals1620/222497438773에서도 확인하실 수 있습니다. 알파고를 통해 AI가 크게 화제가 되면서, 알파고에 사용된 몬테카를로 트리 서치 알고리즘도 화제가 되었습니다. 대학원 세미나를 준비하면서 많은 정보를 보았는데, 한글로 된 정보 중에는 깊은 내용을 다루고 있는 것은 없어서 아쉬움이 있었습니다. 그래서 무료 강의, 논문, 책을 통해 직접 조사를 거쳐 정리해보았습니다. 우선 몬테카를로 트리 서치(Monte Carlo Tree Search, 이하 MCTS)는 MDP(Markov Decision Process)를 해결하는 방법의 한 종류입니다. 알파고 덕분에 강화학습이 유명해져서, "강화학습은 MDP를 푸는 방법이다"..
AI
2021. 9. 7. 10:45