'model-free control' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/06 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Tags more

Archives

Today

Total

관리 메뉴

글쓰기
방명록
RSS
관리

목록model-free control (1)

Let's Run Jinyeah

Model-Free Control

MDP를 모르는 상황에서 최적의 정책을 찾는 Model-Free Control 기법에 대한 리뷰입니다. David Silver의 "Introduction to reinforcement learning" 강의 Lecture 5를 참고하였습니다. Outline On-policy Monte-Carlo(MC) control On-policy Temporal-Difference(TD) learning Sarsa: TD방법으로 액션-가치 함수(Q)를 학습 n-Step Sarsa: MC와 TD의 절충안 Sarsa(λ) Off-policy Temporal-Difference(TD) learning Q러닝 Model-Free Control 문제 MDP model을 모르고, 경험은 샘플링할 수 있는 문제 MDP model..

Deep Learning/Reinforcement Learning 2021. 8. 21. 01:03

Prev 1 Next

목록model-free control (1)

Let's Run Jinyeah

티스토리툴바