タグ

ゲームAIに関するwrssのブックマーク (2)

  • なぜ人間はポーカーでAIに負けたのか? 日本トッププロが解説する“違和感”

    初めまして、プロポーカープレイヤーの木原直哉と申します。「人工知能AI)がポーカーのトッププロ4人に勝った」というニュースが世間をにぎわせています。しかし、これらのニュースを読む中で、自分の認識と違うなと思うことがいくつかありました。 「なぜ、AIは人間に勝てたのか」を始め、このニュースについて自身が感じたことなどを、ポーカープロの立場から解説していきたいと思います。 (編集:ITmedia村上) 木原直哉さんプロフィール 1981年生まれの北海道出身で、2001年に東京大学理科一類に入学。在学中は将棋部に所属し、バックギャモンやポーカーなどの頭脳ゲームに熱中していく。10年かけて東京大学理学部地球惑星物理学科を卒業し、翌2012年の第42回世界ポーカー選手権大会 (2012 World Series of Poker) の「ポット・リミット・オマハ・シックス・ハンデッド」で日人初の世

    なぜ人間はポーカーでAIに負けたのか? 日本トッププロが解説する“違和感”
  • 汎関数を用いた時間攻めの導出(の数学的解説) - コンピュータ将棋 Qhapaq

    前回の記事で紹介した汎関数を用いた時間攻めの導出について解説したのですが、読者の方から数式をもう少し解説して欲しいとのリクエストをいただきましたので、此方にて解説します。 数学マニアじゃない方にも雰囲気が伝わる用に善処はしますが、元が理系大学生が3−4年頃に習うものなので、それなりに高難易度な話です。 1.問題条件の定式化 ・・・x手目に使う持ち時間(単位は秒) ・・・x手目にt秒使った時に正しい手をさせる確率 ・・・今回最大化したいパラメタ。各々の局面において正しい手を指せる確率の和 ・・・持ち時間の総和はHとする 持ち時間を制御することで最大化したいのは、厳密には勝率であり、各々の局面において正しい手を指せる確率の和ではありません。しかし、この記事 で検証したように、この指標はそれなりの精度で勝率と対応してくれていると考えています。 なお、が所謂汎関数というやつです。 2.ラグランジュ

    wrss
    wrss 2017/01/31
    ラグランジュの未定乗数法とか懐かしい(すっかり忘れた)。後でじっくり読んでみます。
  • 1