ゲーム理論の概論①(大まかな枠組み)|ゲーム理論について #1

f:id:lib-arts:20200101162335j:plain

強化学習についての記事などはこれまで多く取り扱ってきましたが、意外とゲーム理論については取り扱っていなかったので、ゲーム理論に関する新シリーズを新たにスタートさせます。
まず手始めにゲーム理論の概論ということで、Wikipediaを確認していきます。

ゲーム理論 - Wikipedia

なかなか情報量が豊富のため、#1では冒頭部の解説と枠組みのところについて取り扱います。
以下目次になります。
1. ゲーム理論の概論
2. 枠組み
2-1. 協力ゲームと非協力ゲーム
2-2. ゲームの表現形式
2-3. ゲームの構成要素
2-4. ゲームの解概念
3. まとめ


1. ゲーム理論の概論
1節ではWikipediaの冒頭部について取り扱います。

f:id:lib-arts:20200101162435p:plain

上記が冒頭部の記述です。「社会や自然界における複数主体が関わる意思決定の問題や行動の相互依存的状況を数学的なモデルを用いて研究する学問である」とされています。
ゲーム理論の対象はあらゆる戦略的状況(strategic situations)で、「戦略的状況」とは自分の利得が自分の行動の他、他者の行動にも依存する状況を意味するとされています。この状況は経済学だけでなく、経営学政治学、法学、社会学、人類学、心理学、生物学、工学、コンピュータ科学などの様々な学問分野にも見られると言及されています。

「戦略」は経営や外交など様々な分野で使われる言葉なので、注意してチェックしておくと良さそうです。また、ゲーム理論の応用分野が非常に幅広いというのも着目しておくと良いと思われます。

記述については一通り確認できたので1節はここまでとします。


2. 枠組み
2-1. 協力ゲームと非協力ゲーム
2-1節では協力ゲームと非協力ゲームについて取り扱っていきます。

f:id:lib-arts:20200101163828p:plain

上記によると、協力ゲーム理論(cooperative game theory)は複数のプレイヤーが拘束力のある合意を結ぶ状況を扱い、非協力ゲーム理論(noncooperative game theory)は個々のプレイヤーが独立に行動する状況を扱うとされています。

f:id:lib-arts:20200101164404p:plain

1951年にジョン・ナッシュによって協力ゲームと非協力ゲームという二つに分けて元々は定義された一方で、協力ゲームと非協力ゲームの区別は段々と曖昧になっているとされています。詳細については必要に応じて確認していくとして、一旦は1951年時点のジョン・ナッシュによるオリジナルの文脈で言葉の大まかな意味合いだけつかんでおけば十分そうです。


2-2. ゲームの表現形式
2-2節ではゲームの表現形式について取り扱っていきます。

f:id:lib-arts:20200101164810p:plain

上記ではゲームの代表的な表現形式として、戦略形展開形提携形の三つが挙げられています。それぞれ、表に表されたように協力ゲームと非協力ゲームとそれぞれ関連があるとされています。以下、戦略形、展開形、提携形の三つの表現形式について確認していきます。

f:id:lib-arts:20200101165212p:plain

まずは戦略形(strategic form)について見ていきます。数式的な定義を追うほど一旦複雑に考えなくても良さそうなので、ここでは双行列(bimatrix)の記述だけ一旦抑えておくと十分そうです。双行列は囚人のジレンマの利得表と同様なものと捉えておくと良いと思われます。

f:id:lib-arts:20200101165532p:plain

次に展開形(extensive form)について確認します。展開形の定式化の方法の一つとしてゲームの木(game tree)が挙げられています。3×3のOXゲームや五目並べ、オセロ、将棋、囲碁のゲーム展開は全てこのようなゲームの木で表現することができます。

f:id:lib-arts:20200101170021p:plain

三点目として提携形(coalitional form)について確認します。あまり詳しい記述がないですが、提携形は特性関数(characteristic function)によって主に記述されると考えておくと良さそうです。


2-3. ゲームの構成要素
2-3節ではゲームの構成要素について取り扱っていきます。

f:id:lib-arts:20200101170729p:plain

基本的には上記にまとめられています。よくよく見てみると、展開形ゲームは強化学習とほぼ同様な問題設定となっています。要出典ですが、おそらく強化学習は展開形ゲームの問題設定に対する解法の一つであると捉えておいて良いと思われます。プレイヤーはAgent、戦略集合はAction、利得関数はRewardと置き換えても話は成り立ちそうです。


2-4. ゲームの解概念
2-4節ではゲームの解概念について取り扱っていきます。

f:id:lib-arts:20200101171527p:plain

上記によると、ゲーム理論における解(solution)は、「特定の性質を持ったゲームに置いて現れる可能性のある結果を体系的に記述したものである」とされています。eductiveな解釈でもevoltiveな解釈においても、何らかの均衡に到達するため、それらを解と見なしているようです。
均衡としては下記の五つが挙げられています。

・強支配戦略均衡
・被支配戦略逐次排除均衡
ナッシュ均衡
・サブゲーム完全均衡
ベイジアン均衡点

詳細については今回の目的としては概要の把握のため省略します。


3. まとめ
#1ではゲーム理論の概論と大枠の枠組みについて取り扱いました。強化学習との関連で見ると非常に興味深い内容になっていました。
#2では引き続きWikipediaの記述を確認していきます。