タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

wikiとexamに関するpunipunitakaのブックマーク (2)

  • ナッシュ均衡 - Wikipedia

    まず Pa の利得に注目すると、Pb がどちらの戦略を選ぼうが、Pa は A1 戦略を選んだ方がより大きな利得を得ることができる。このような関係が成り立つとき、A1 は強支配戦略であると表現する。支配するとは、ある戦略を選ぶことが他方の戦略を選ぶより有利であるという意味である。 次に Pb の利得に注目すると、Pa がどちらに戦略を選んでも、B2 戦略を選んだ方が B1 戦略のとき以上の利得を得られる。Pa が A2 戦略を選んだ場合には B1 と B2 は同等になるので、このような関係のとき B2 は弱支配戦略であるという。 結果として、Pa にとっての最適戦略は A1、Pb にとっての最適戦略は B2 となり、両者ともここから戦略を変更しても利得は減る。この組み合わせ (A1, B2) が支配戦略均衡となる。 Pa、Pb が (A1, B2) という戦略をとった場合、Paは戦略を変更し

  • 囚人のジレンマ - Wikipedia

    この項目では、ゲーム理論について説明しています。横山秀夫原作の「囚人のジレンマ」(「第三の時効」所収)については「第三の時効」をご覧ください。 囚人のジレンマ(しゅうじんのジレンマ、英: prisoners' dilemma)とは、ゲーム理論におけるゲームの1つ。お互い協力する方が協力しないよりもよい結果になることが分かっていても、協力しない者が利益を得る状況では互いに協力しなくなる、というジレンマである[1]。各個人が合理的に選択した結果(ナッシュ均衡)が社会全体にとって望ましい結果(パレート最適)にならないので、社会的ジレンマとも呼ばれる[2]。 1950年に数学者のアルバート・タッカーが考案した[3]。ランド研究所のメリル・フラッド(英語版)とメルビン・ドレシャー(英語版)の行った実験をもとに、タッカーがゲームの状況を囚人の黙秘や自白にたとえたため、この名がついている[4]。 囚人の

  • 1