'reinforcement learning' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/10 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

글쓰기
방명록
RSS
관리

목록reinforcement learning (1)

Let's Run Jinyeah

Model-Free Control

MDP를 모르는 상황에서 최적의 정책을 찾는 Model-Free Control 기법에 대한 리뷰입니다. David Silver의 "Introduction to reinforcement learning" 강의 Lecture 5를 참고하였습니다. Outline On-policy Monte-Carlo(MC) control On-policy Temporal-Difference(TD) learning Sarsa: TD방법으로 액션-가치 함수(Q)를 학습 n-Step Sarsa: MC와 TD의 절충안 Sarsa(λ) Off-policy Temporal-Difference(TD) learning Q러닝 Model-Free Control 문제 MDP model을 모르고, 경험은 샘플링할 수 있는 문제 MDP model..

Deep Learning/Reinforcement Learning 2021. 8. 21. 01:03

Prev 1 Next

목록reinforcement learning (1)

Let's Run Jinyeah

티스토리툴바