태그
바닥부터 배우는 강화학습
밑바닥부터 시작하는 딥러닝
RNN
바닥부터 배우는 강화학습 총정리
밑바닥 딥러닝 6장
MDP를 모를 때 최고의 정책 찾기
MDP를 알 때의 플래닝
밸류 이터레이션
정책 이터레이션
액션 밸류
상태 밸류
최적 밸류
벨만 최적 방정식
벨만 기대 방정식
밑바닥 딥러닝
회귀 모델
최적 정책
밑바닥부터 시작하는 딥러닝2
강화학습 정리
마르코프 결정 프로세스
JAVA#자바#상속#생성자
JAVA#자바#생성자
java #static #new #객체
분류 모델
Q러닝
기울기 소실
기울기 폭발
RNNLM
BPTT
추론 기반 기법
통계 기반 기법
CBOW
LSTM
하이퍼파라미터
word2vec
벨만 방정식
재귀 함수
Sarsa
딥러닝
강화학습
회귀
MDP
머신러닝
MRP
마르코프
분류
정책평가
TD
알고리즘
게이트
MC