2019-05-18から1日間の記事一覧

Deep Q-Network⑤における工夫|強化学習フォローアップシリーズ #5

#1では連載の経緯とDQNの理解にあたって簡単な全体像について言及し、#2ではマルコフ決定過程、#3では価値関数とベルマン方程式、#4ではQ-Networkについてまとめました。 https://lib-arts.hatenablog.com/entry/followup_reinforce4#4までで基本的な仕組み…