にんじんブログ

にんじんの生活・勉強の記録です。

MENU にんじんコンテンツを一望しよう!「3CS」

にんじんと読む「ゲーム理論の見方・考え方」 第三章

第三章 対立、協調、交渉

 前章において扱った不確実性下での個人の意思決定問題は、不確実性が相手だったが、現実の社会では「他のプレイヤー」が相手である。この違いは、相手の行動によって自分の行動が変わり、またその逆も成り立つという相互依存関係にある。

 ゲームに参加するプレイヤーの集合、彼らがとりうる行動の集合、実現可能な結果の集合、行動の組み合わせと結果の対応関係、結果に対するそれぞれの選好順序という五つの要素から成り、最後の選好順序がフォン・ノイマン=モルゲンシュテルンの公理を満たし、さらにプレイヤーは各々の期待効用を最大にするように動く―――これが数学におけるゲームの基本的なモデルである。

 ゲームの種類は数多いが、まず扱われるのが「完全対立2人ゲーム」である。サッカーにおけるキッカーとキーパーのように、二つの目標が完全に対立しているようなゲームのことである。

 プレイヤーは1と2の二人。戦略はそれぞれa,bの二つ。もし2がaをとるとすれば、1としてはaをとれば50、bをとれば30の利得が入る。もし2がbをとるとすれば、a→70、b→50の利得が入るとしよう。利得が多いほうを人は選択すると仮定しているので、2がaをとってきたら当然1はaをとるし、bをとってきたら1としてはaを選択する。このように、相手がどんな戦略をとってこようがaはbより優れた戦略である。このような戦略を優位戦略といい、対するbは劣位戦略と呼ばれる。だから『劣位選択を選択しない。もし優位戦略があれば優位戦略を選択する』と決めることは極めて当たり前のことである。ただし、一般のゲームではここまでわかりやすい戦略があるとは限らない。

 

 考察を進めるために、単に完全対立2人ゲームというだけでなく、ゼロサムゲームでもあるようなゲームに限定して考えよう。これは自分がa点得をするときに、相手がa点失うようなゲームである。

 プレイヤー1、2に対して下図のようなゲームを考える。相手がaをとってきたとき、こちらがa→2、b→6、c→8を得るようなゲームとなっている。相手が何をとろうが、戦略aは最低でも利得2を得てくれる。これをaの保証水準という。同様にbの保証水準は5、cの保証水準は2である。保証水準の中で最も大きな値をとる戦略bをマックスミニ戦略という(最低の争いであるミニの戦略にマックスがついている)。戦略bをとれば5が保証され、安心である。

 今度はプレイヤー2の視点でみよう。この表は1視点で書かれているから、2にとっては損失の表である。損失が最も大きくなるのはaとcで、5におさえてくれるのはbである。この戦略bをミニマックス戦略と呼ぶ。自分の立場からも、相手の立場からも、ゲームの結果は5になるので、合理的な選択は次のようになる。『ゼロサムゲームでマックスミニ値とミニマックス値が等しいならば、マックスミニ戦略あるいはミニマックス戦略を選択する』。

  a b c min
a 2 4 8 2
b 6 5 6 5
c 8 4 2 2
max 8 5 8 -

 

 今度はペナルティキックの場面を考えてみよう(キーパー視点)。相手が左に蹴ってきたときに右に飛んでいたら1点失う。ミニマックスとマックスミニが異なるのでさっきと同じようにはいかない。キーパーとしては相手が蹴ったほうと同じほうへ飛びたいし、キッカーとしては相手と違うほうへ蹴りたい。読み合いは堂々巡りし、落ち着きどころがない。そこでもはや、確率に頼るしかない。

 
1 -1
-1 1

 キーパーは確率pで右に飛び、1-pで左に飛ぶことを決めた。キーパーの期待利得はキッカーが左をとるならば2p-1となる。右をとるならば1-2pとなる。するとキーパーの保証水準はこの最小値となる。つまりpが0.5より小さいならば最小値は2p-1で、逆ならば1-2pが最小になる。というわけで、キーパーとしてはp=1/2と決めるのが期待利得を最も大きくする。マックスミニ値はゼロ。

 同様にキッカーに対して確率qを用いて同様の計算をすると、ミニマックス値は0となり、もちろんq=1/2が損失を最も小さくする。

 ふたりのマックスミニ値とミニマックス値が一致したので、2人の合理的な戦略は「左右を1/2で決める」と考えることになる―――あとはコインでも投げて、運に任せるだけだ。

 

 フォン・ノイマンはすべてのゼロサムゲームにおいて、確率的戦略によるマックスミニとミニマックスが等しいことを証明した(ミニマックス定理)。だが非ゼロサムにおいてはミニマックス戦略は必ずしも合理的とはならない。非ゼロサムゲームにおいては相手の戦略を予想して、自分にとって最適なものを選ばなければならない(最適応答戦略)。

 この最適応答戦略が期待効用最大化原理と異なるのは、後者と違い、前者は一人のプレイヤーだけでなくゲームに参加するすべてのプレイヤーに適用されるものだということだ。もし戦略sが相手の戦略tに対する最適応答で、逆に相手からしても最適になるように、互いの手を読み合うだろう。この均衡点を「ナッシュ均衡」と呼ぶ。これはゼロサムゲームのミニマックス戦略という均衡でもあり、非ゼロサムという一般の場合に拡張したものと解釈できる。

 ナッシュ均衡は利得を当然求める合理的なプレイヤーが、確実に到達する結論である。他に大きな利得が得られる戦略があるのに、それを選択しないなど考えられない。数学者のナッシュは、すべてのゲームに少なくともひとつナッシュ均衡が存在することを示した。

 とはいえ、ナッシュ均衡は複数存在し得る。これを複数均衡問題といい、この場合はプレイヤーの行動が予測できない。つまりナッシュ均衡だけではこの問題に対処できない。たとえば待ち合わせゲームを考えると、場所A、Bのどちらかの選択はまったく利得として対称になる。二人のプレイヤーは相手と会わないと意味がないからだ。利得としては戦略AもBも同じなので、表を眺めているだけではどうにもならない。

 現実社会においては「何度もあそこ行ってるし今日も居るかも」というように考える。このように、複数均衡問題を解決するための期待形成の他s家となる文化的・社会的・物理的な要因をフォーカル・ポイントという。これを手掛かりに、たとえば女性の立場を優先する社会では女性の望むであろうナッシュ均衡が選択されるだろう。この解法は数学的なものではないが、後年、ナッシュが合理的な戦略を導いた。そこで用いた新たな装置が、「パレート最適」である。ある戦略の組がパレート最適でないということは、プレイヤー全員によってより望ましい戦略があるということである。

  1.  交渉解(いくつもある均衡たち)はパレート最適(そうでないと他により望ましい戦略がある)
  2.  プレイヤーの立場が対等であれば、交渉解はプレイヤーに等しい効用を与える(立場が同じなのに他のプレイヤーに有利な戦略になど同意しない)
  3.  プレイヤーの効用が正1次変換されても実質的に同じ(フォン・ノイマン=モルゲンシュテルン効用を使う限り必要になるもの)
  4.  解以外の戦略が実行不能になっても、解は変わらない(最初の話し合いで他のどれより優れていると決まったのに実行不能になったからといって順序が変わるわけがない)

 この公理を満たす交渉解を持つ非ゼロサムゲームは合理的な答えがあることをナッシュが証明した。