2019-05-21から1日間の記事一覧

OpenAI Gymの仕様を掴む③（Atari_前編_Pong）｜実装で理解する深層強化学習の研究トレンド #3

DeepLearning Reinforcement Machine Learning

連載の経緯については#1に記しました。 #1ではCartPoleを題材に強化学習のアルゴリズムの開発にあたってのToolkitであるOpenAI Gymの概要、#2ではCartPole問題に関する仕様の詳細やアルゴリズムの改善にあたっての試行錯誤について取り扱いました。 #1と#2で…