Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 |
Tags
- webhacking
- c++
- 파이썬
- hackerschool
- BOF
- 러닝 스칼라
- hacking
- 딥러닝
- hackthissite
- 백엔드
- 경제
- deep learning
- Web
- c
- BOF 원정대
- flask
- Linux
- 웹해킹
- Javascript
- 리눅스
- ChatGPT
- 러닝스칼라
- mysql
- Python
- php
- backend
- Shellcode
- 인공지능
- Scala
- 챗GPT
Archives
- Today
- Total
목록2023/02/27 (1)
jam 블로그
[강화 학습] 1990년 이후 강화학습 관련 모델이나 기법
Q-Learning (1992): 이후 강화학습 분야의 대표적인 알고리즘 중 하나인 Q-Learning이 Watkins와 Dayan에 의해 제안됨. [논문: "Q-Learning", 1992] TD-Gammon (1995): 텐니스 게임에서의 자가 학습을 통해 세계 챔피언을 이긴 최초의 강화학습 모델인 TD-Gammon이 제안됨. [논문: "Temporal Difference Learning of Backgammon Strategy", 1995] DQN (2013): DeepMind에서 개발된 Deep Q-Network(DQN)은 딥러닝을 강화학습에 적용한 첫번째 모델로, Atari 게임에서 인간 수준의 성능을 보임. [논문: "Playing Atari with Deep Reinforcement Lear..
인공지능
2023. 2. 27. 21:07