본문 바로가기

태그

바닥부터 배우는 강화학습 밑바닥부터 시작하는 딥러닝 RNN 바닥부터 배우는 강화학습 총정리 밑바닥 딥러닝 6장 MDP를 모를 때 최고의 정책 찾기 MDP를 알 때의 플래닝 밸류 이터레이션 정책 이터레이션 액션 밸류 상태 밸류 최적 밸류 벨만 최적 방정식 벨만 기대 방정식 밑바닥 딥러닝 회귀 모델 최적 정책 밑바닥부터 시작하는 딥러닝2 강화학습 정리 마르코프 결정 프로세스 JAVA#자바#상속#생성자 JAVA#자바#생성자 java #static #new #객체 분류 모델 Q러닝 기울기 소실 기울기 폭발 RNNLM BPTT 추론 기반 기법 통계 기반 기법 CBOW LSTM 하이퍼파라미터 word2vec 벨만 방정식 재귀 함수 Sarsa 딥러닝 강화학습 회귀 MDP 머신러닝 MRP 마르코프 분류 정책평가 TD 알고리즘 게이트 MC

티스토리툴바