일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 프레임워크
- C#
- 직장인공부
- base64
- job
- 패스트캠퍼스후기
- 가이드
- ui
- Job 시스템
- 커스텀 패키지
- AES
- sha
- unity
- 2D Camera
- 패스트캠퍼스
- Custom Package
- Tween
- 환급챌린지
- DotsTween
- 샘플
- TextMeshPro
- RSA
- 암호화
- 오공완
- Unity Editor
- adfit
- 직장인자기계발
- Dots
- 최적화
- Framework
- Today
- Total
목록전체 보기 (189)
EveryDay.DevUp

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.https://bit.ly/4hTSJNB 커리어 성장을 위한 최고의 실무교육 아카데미 | 패스트캠퍼스성인 교육 서비스 기업, 패스트캠퍼스는 개인과 조직의 실질적인 '업(業)'의 성장을 돕고자 모든 종류의 교육 콘텐츠 서비스를 제공하는 대한민국 No. 1 교육 서비스 회사입니다.fastcampus.co.krCh05-03 MC 와 TD 실습- Colab을 사용하여 정책, 에피소드 횟수, 러닝 레이트를 조정하여 결과 확인Ch05-04 MC vs TD- 평가의 기준1) 학습 시점- MC는 에피소드 종료 후 학습을 하지만 TD는 한 스텝만 끝나도 학습을 하기 때문에 유연성 측면에서 TD가 좋음2) Bias- MC는 편향되지 않은 추정치를 가지지만,..

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.https://bit.ly/4hTSJNB 커리어 성장을 위한 최고의 실무교육 아카데미 | 패스트캠퍼스성인 교육 서비스 기업, 패스트캠퍼스는 개인과 조직의 실질적인 '업(業)'의 성장을 돕고자 모든 종류의 교육 콘텐츠 서비스를 제공하는 대한민국 No. 1 교육 서비스 회사입니다.fastcampus.co.krCh04-02 Policy Iteration- 정책이 주어졌을 때 정책을 평가하도 개선하는 것을 반복함- 반복 횟수를 정하고 최적 정책을 구함Ch04-03 Value Iteration- Policy Iteration의 핵심은 정책의 벨류(리턴의 기댓값)을 이용해 greedy 정책을 만듬- Value Iteration은 벨만 최적 방정식을 이..

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.https://bit.ly/4hTSJNB 🎉누적 구매수 111만 건 돌파 감사제 100% 페이백 (04.21 - 04.26) | 패스트캠퍼스통 크게! 전 구매 고객께 결제 금액을 100% 돌려드립니다!fastcampus.co.krCh03.Introduction to RL 벨만 방정식- 대부분의 강화학습읔 벨류를 구하는 것에서 출발하는데, 벨류를 구하기 위한 뼈대가 되는 수식이 벨만 방정식Ch03-01 벨만 기대 방정식 0단계- 벨류 사이의 재귀적 관계를 구하는 식- 현재 상태의 벨류는 리워드를 하나 받고 그 다음 상태의 벨류를 더한 것과 같음Ch03-02 벨만방정식 1,2 단계- 1단계의 수식은 정책에 의한 확률을 구하는 식과 전위 확률에..

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.https://bit.ly/4hTSJNB Chapter02. Introduction RL - Markov Desision Process- 강화학습에서 문제를 잘 정의하려면 주어진 문제를 MDP의 형태로 만들어야함 Ch02-01 Markov Process- 확률적으로 상태를 이동해 다니는 과정- 상태의 집합과 전이 확률 (전이 확률 행렬)로 표현됨- 마르코프 프로퍼티: 미래는 오로지 현재에 의해 결정됨: Markov Process 는 마르코프 프로퍼티 정의를 반영한 것Ch02-02 Markov Reward Process- Markov Process에서 다음 상태에 도달할 때 리워드를 받는 것이 추가됨- 보상을 ..