タグ

pokerに関するkenkitiiのブックマーク (3)

  • テキサスホールデムの最適解は求まるか | Scene Research Station

    これは以前テキサスホールデムのゲーム理論上の最適解について調べ物をしていたときの備忘録です。 ゲーム理論とは ここを読んでいただくのが手っ取り早いですが、複数人のプレイヤでゲームをするとき、どうやったら最大の利益が得られるかを考える学問です。第二次世界大戦前後にフォン・ノイマンが戦略を確率的に混ぜた混合戦略を用いることで様々なゲームにおいて均衡が見つかることを示し、そこから軍事等に応用されました。さらにナッシュが非協力n人ゲームでも均衡が存在することを示し、殆どの現実のモデルにゲーム理論を適用可能となりました。当然ポーカーにも理論上は適用可能です。もし均衡が分かれば、それは絶対に搾取されない無敵の戦略となります。(ただし誰にも負けないことを保証するだけで、プラスになるとは限りません。例えば、ジャンケンのナッシュ均衡はグーチョキパーを1/3ずつの割合で出す戦略ですが、誰にも負けませんが誰にも

  • テキサスホールデム(ポーカー)の必勝プログラムが完成 ついに不完全情報ゲームでもコンピュータが人間を上回る

    カナダのアルバータ大学は1月9日(日時間)、ヘッズアップリミットホールデム(ポーカーの1種)において、コンピュータソフト「Cepheus」が“完全プレイ”を解析したと発表しました。研究成果をまとめた論文が米科学誌サイエンス(電子版)に掲載されています。 研究チームのマイケル・ボウリング博士(左) ヘッズアップリミットホールデムとは、手札2枚と共通カード(最大5枚)を組み合わせる「テキサスホールデム」という形式を1対1(ヘッズアップ)で行うもの。リミットとは賭け金が決められているタイプです(有り金を全部賭けるオールインなどは不可)。 つまり、同ゲームでは一定額ずつチップをかけての勝負(降りてもよい)を何度も行います。これを長期的にプレイすると「Cepheus」は絶対に負けないそうです。ポーカーは「不完全情報ゲーム」であり、相手の手札がわからないことからブラフも有効でしたが、リミットゲーム

    テキサスホールデム(ポーカー)の必勝プログラムが完成 ついに不完全情報ゲームでもコンピュータが人間を上回る
  • プロのポーカープレイヤーって何? 優勝賞金5000万円を手にした男に聞く

    プロのポーカープレイヤーって何? 優勝賞金5000万円を手にした男に聞く:世界王者・木原直哉氏の生き方(1/6 ページ) 優勝賞金5000万円――。2012年6月に開催された世界ポーカー選手権大会で日人初の世界タイトルを獲得したプロ・ポーカープレイヤーの木原直哉氏が手にした賞金だ。 プロ・ポーカーってなに? と感じられた読者も多いだろう。日ではあまり聞き慣れない職業だが、東大卒の経歴を持つ木原氏はなぜギャンブルのイメージが強いその道を選んだのだろうか。知られざるポーカーの世界や、ポーカーとどう向き合っているかについて、話を聞いた。 木原直哉氏のプロフィール: 1981年生まれの北海道出身で、2001年に東京大学理科一類に入学。在学中は将棋部に所属し、バックギャモンやポーカーなどの頭脳ゲームに熱中していく。10年かけて東京大学理学部地球惑星物理学科を卒業し、翌2012年の第42回世界ポー

    プロのポーカープレイヤーって何? 優勝賞金5000万円を手にした男に聞く
  • 1