Notice
														
												
											
												
												
													Recent Posts
													
											
												
												
													Recent Comments
													
											
												
												
													Link
													
											
									| 일 | 월 | 화 | 수 | 목 | 금 | 토 | 
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 | 
| 12 | 13 | 14 | 15 | 16 | 17 | 18 | 
| 19 | 20 | 21 | 22 | 23 | 24 | 25 | 
| 26 | 27 | 28 | 
													Tags
													
											
												
												- Shellcode
 - hackthissite
 - mysql
 - Python
 - hackerschool
 - 백엔드
 - Javascript
 - c
 - Web
 - backend
 - php
 - 딥러닝
 - 경제
 - 러닝스칼라
 - Scala
 - hacking
 - flask
 - BOF 원정대
 - Linux
 - 챗GPT
 - ChatGPT
 - c++
 - 파이썬
 - deep learning
 - 인공지능
 - webhacking
 - 웹해킹
 - 리눅스
 - 러닝 스칼라
 - BOF
 
													Archives
													
											
												
												- Today
 
- Total
 
목록2023/02/27 (1)
jam 블로그
			
			
				[강화 학습] 1990년 이후 강화학습 관련 모델이나 기법
				
	
	
               
           
					
					
					
					
					
					
						
					
				Q-Learning (1992): 이후 강화학습 분야의 대표적인 알고리즘 중 하나인 Q-Learning이 Watkins와 Dayan에 의해 제안됨. [논문: "Q-Learning", 1992] TD-Gammon (1995): 텐니스 게임에서의 자가 학습을 통해 세계 챔피언을 이긴 최초의 강화학습 모델인 TD-Gammon이 제안됨. [논문: "Temporal Difference Learning of Backgammon Strategy", 1995] DQN (2013): DeepMind에서 개발된 Deep Q-Network(DQN)은 딥러닝을 강화학습에 적용한 첫번째 모델로, Atari 게임에서 인간 수준의 성능을 보임. [논문: "Playing Atari with Deep Reinforcement Lear..
				인공지능
				
				2023. 2. 27. 21:07