2019-07-10から1日間の記事一覧

Deep Q-Network〜Rainbowの研究の流れと実装①(Rainbowの論文の確認)|実装で理解する深層強化学習の研究トレンド #6

連載の経緯については#1に記しました。 #1〜#5では問題設定の確認ということでOpenAI Gymについて取り扱いました。 #6からはアルゴリズムのトレンドということで、Rainbow[2017]に関しての情報を中心にDeep Q-Networkの拡張(extension)について取り扱います…