2019-11-16から1日間の記事一覧

Ch_6 Temporal-Difference Learning|『Reinforcement Learning(by Sutton)』を読み解く #1

強化学習に関しては概要の確認やDeep Q Network関連を中心とした論文の解説や実装の確認などをこれまで行ってきましたが、ベースの知識の再整理ということで『Reinforcement Learning(by Sutton)』をまとめていければと思います。 https://www.andrew.cmu.ed…