'UCT' 태그의 글 목록

UCT

UCT(Upper Confidence Boundary of Tree)에 대한 정확한 정리

이전 포스팅 '몬테카를로 트리 서치 (Monte Carlo Tree Search)에 대한 정확한 정리'에서 tree policy를 다루었습니다. Tree policy는 선택(Selection) 단계에서 확장(Expansion)을 이어나갈 child node를 선택할 때 사용하는 정책이며, 알파고의 경우 이용(exploitation)과 탐사(exploration)의 균형을 맞추어 이용-탐사 딜레마를 해결하기 위해 tree policy로 UCT(Upper Confidence Boundary of Tree)가 사용되었고, UCT는 UCB1(Upper Confidence Boundary)이 tree에 사용되었다고 해서 붙은 이름이라는 것이 지난 포스팅의 내용이었습니다. 우선 아래 그림을 통해 UCB1을 이해해 ..

AI 2021. 9. 27. 13:56

몬테카를로 트리 서치 (Monte Carlo Tree Search)에 대한 정확한 정리

※해당 포스팅은 제 네이버 블로그 https://blog.naver.com/gusals1620/222497438773에서도 확인하실 수 있습니다. 알파고를 통해 AI가 크게 화제가 되면서, 알파고에 사용된 몬테카를로 트리 서치 알고리즘도 화제가 되었습니다. 대학원 세미나를 준비하면서 많은 정보를 보았는데, 한글로 된 정보 중에는 깊은 내용을 다루고 있는 것은 없어서 아쉬움이 있었습니다. 그래서 무료 강의, 논문, 책을 통해 직접 조사를 거쳐 정리해보았습니다. 우선 몬테카를로 트리 서치(Monte Carlo Tree Search, 이하 MCTS)는 MDP(Markov Decision Process)를 해결하는 방법의 한 종류입니다. 알파고 덕분에 강화학습이 유명해져서, "강화학습은 MDP를 푸는 방법이다"..

AI 2021. 9. 7. 10:45

이동통신 대학원생

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

UCT

추가 정보

인기글

최신글

페이징

티스토리툴바