[B! wiki][exam] punipunitakaのブックマーク

punipunitaka id:punipunitaka

wikiとexamに関するpunipunitakaのブックマーク (2)

ナッシュ均衡 - Wikipedia
まず Pa の利得に注目すると、Pb がどちらの戦略を選ぼうが、Pa は A1 戦略を選んだ方がより大きな利得を得ることができる。このような関係が成り立つとき、A1 は強支配戦略であると表現する。支配するとは、ある戦略を選ぶことが他方の戦略を選ぶより有利であるという意味である。次に Pb の利得に注目すると、Pa がどちらに戦略を選んでも、B2 戦略を選んだ方が B1 戦略のとき以上の利得を得られる。Pa が A2 戦略を選んだ場合には B1 と B2 は同等になるので、このような関係のとき B2 は弱支配戦略であるという。結果として、Pa にとっての最適戦略は A1、Pb にとっての最適戦略は B2 となり、両者ともここから戦略を変更しても利得は減る。この組み合わせ (A1, B2) が支配戦略均衡となる。 Pa、Pb が (A1, B2) という戦略をとった場合、Paは戦略を変更し
punipunitaka 2006/09/20
exam

wiki
リンク
囚人のジレンマ - Wikipedia
この項目では、ゲーム理論について説明しています。横山秀夫原作の「囚人のジレンマ」（「第三の時効」所収）については「第三の時効」をご覧ください。囚人のジレンマ（しゅうじんのジレンマ、英: prisoners' dilemma）とは、ゲーム理論におけるゲームの1つ。お互い協力する方が協力しないよりもよい結果になることが分かっていても、協力しない者が利益を得る状況では互いに協力しなくなる、というジレンマである[1]。各個人が合理的に選択した結果（ナッシュ均衡）が社会全体にとって望ましい結果（パレート最適）にならないので、社会的ジレンマとも呼ばれる[2]。 1950年に数学者のアルバート・タッカーが考案した[3]。ランド研究所のメリル・フラッド（英語版）とメルビン・ドレシャー（英語版）の行った実験をもとに、タッカーがゲームの状況を囚人の黙秘や自白にたとえたため、この名がついている[4]。囚人の
punipunitaka 2006/09/20
exam

wiki
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx