Go Gradually - Repository

  • CS
  • PS
  • Backend
  • 개발
  • GitHub
  • 홈

Advantage 1

[강화학습] A2C

지난 글에선 REINFORCE 알고리즘을 공부했다.이 알고리즘은 간단한 CartPole 예제에는 잘 작동했지만, 좀 더 복잡한 환경의 강화학습에는 그리 잘 통과하지 않는다. 한편, DQN의 경우 이산적인 동작 공간에서 상당히 효과적이지만, 입실론-그리디 정책같은 개별적인 정책 함수가 필요하다는 단점이 있다. 이번 글에서는 REINFORCE의 장점과 DQN의 장점을 합친 actor-critic(행위자-비평자)라는 알고리즘을 소개한다.이 모델은 여러 문제 영역에서 최고 수준의 성과를 낸 바 있다.REINFORCE 알고리즘은 일반적으로 일회적 알고리즘(에피소딕, episodic algorithm)으로 구현된다.이는 에이전트가 하나의 에피소드 전체를 끝낸 후에야 그 에피소드에서 수집한 보상들로 모델의 매개변수들..

AI Repository/기초 강화학습 2025.09.21
이전
1
다음
더보기
프로필사진

Go Gradually - Repository

목표: 핀잇 실사용자 1명 이상 확보하기 盡人事待天命

  • 분류 전체보기 (243)
    • Article - 깊게 탐구하기 (43)
      • 도메인 주도 설계 이해하기 (9)
      • 트랜잭션 완전정복 (2)
      • 모-던한 프로그래밍 (2)
      • OS - Deep Dive (6)
      • Network - Deep Dive (4)
      • 개발 꿀팁 (9)
      • 피드 한 줌 (1)
      • 핀잇 (2)
      • 핀잇 일지 (0)
      • 개인 프로젝트 (3)
      • OpenAI Gym (3)
    • CS Repository (54)
      • 소프트웨어 공학 - Clean Code & Arc.. (4)
      • 객체지향 & Design Pattern + @ (1)
      • 운영체제 - Dinosaur Book + @ (1)
      • DB (2)
      • 네트워크 - Top-down Approach + .. (26)
      • 데이터 중심 애플리케이션 설계 (1)
      • 리팩터링 (4)
      • 엔터프라이즈 애플리케이션 아키텍처 패턴 (3)
      • HTTP 완벽 가이드 (8)
      • 프로그래밍 패러다임 (3)
    • AI Repository (49)
      • 기초 통계학 (13)
      • 기초 딥러닝 (12)
      • 기초 강화학습 (17)
      • DRL (7)
    • WEB BE Repository (33)
      • JAVA (5)
      • Spring (5)
      • JPA (1)
      • AWS (5)
      • 배포 및 운영 (3)
      • 주니어 백엔드 개발자가 반드시 알아야 할 실무 지.. (2)
      • Redis (1)
      • Spring Security (3)
      • RabbitMQ (7)
    • WEB FE Repository (7)
      • React (5)
    • PS (3)
      • 이론 (2)
      • USACO Silver (1)
      • USACO Gold (6)
      • Baekjoon OJ (4)
      • Codeforces (7)
    • 주간 회고 - 체크리스트 (21)
    • 개인적 공간 (10)
      • 방광암 치료 (2)
      • 체스 (1)

Tag

Pub-Sub, 누적 합, math, DRL, DP, USACO Gold, LeetCode, 마틴 파울러, PS, 오블완, 리팩터링, DQN, binary search, 도메인 이벤트, prefix sum, Python, Greedy, rabbitmq, 티스토리챌린지, 신경망,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • GoGradually 의 Repository 입니다.

Archives

Calendar

«   2025/11   »
일 월 화 수 목 금 토
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

  • GitHub

티스토리툴바