zu2のブックマーク - はてなブックマーク

将棋の棋譜数：“10の220乗”説の真相！？ : コンピュータ将棋基礎情報研究所

以前の記事「将棋の局面数　２：分岐の迷宮」のコメント欄において、Ulyemon様に教えていただいたのですが、「10の220乗」という数は、「将棋の局面数」を表すのではなく、「将棋であり得る棋譜の数」を表しているという説があるようです。確かに局面数ではなくて棋譜数を表しているのだとしたら、合流局面を考慮する必要はありません。しかし、本当に将棋の棋譜数は「10の220乗」なのでしょうか？　今回は、将棋の棋譜数について考えてみたいと思います。本題に入る前に、Ulyemon様にご紹介いただいたWikipediaの「Game complexity」の項目に記してあることについて簡単に紹介します。「ゲームの複雑性」を測る指標には「state-space complexity（状態空間複雑性）」「game-tree complexity（ゲーム木複雑性）」等があります。前者は、初期局面から到達可能な

zu2 2020/07/17

リンク

ミニマックス法の有効性　１：Silver論文の私的解釈 : コンピュータ将棋基礎情報研究所

2017年12月5日に投稿されたGoogle DeepMind社のグループによるプレプリント論文「Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm」（以下、Silver論文）が大きな話題となっています。DeepMind社は、以前、深層学習と強化学習により、囲碁の専門知識を使わずに最強の囲碁ソフトAlpha Go Zeroを作り上げて、大きな衝撃を与えました。今回の論文では、Alpha Go Zeroと同様の手法（以下、AlphaZero）をチェスと将棋に適用し、それぞれ“世界最強”ソフトを作成したということを報告しています。この“世界最強”の部分については、現在、様々な論議がなされているところでありますが、この論文で重要なのは「汎用的な枠組みによって専用系に匹敵する結果が

zu2 2017/12/13

“すなわち、Silver論文の結果は、将棋（やチェス）におけるミニマックス探索の有効性に疑問を投げかけるものであると解釈することができると思われます” これはまったく同感。

リンク

2016年版floodgate棋譜集における半期毎のレート推定 : コンピュータ将棋基礎情報研究所

「floodgate棋譜集レートの最尤法との比較一覧（2012～2016年版）」の記事において、「うさぴょんの育ての親」様から「名前を変えないまま中身が変わっているモノ」がレート推定に大きな影響を与えているのではないかというご指摘がありました。特に2016年はソフトのレート上昇が著しかった時期であり、世界コンピュータ将棋選手権があった前期と電王トーナメントがあった後期とでは「中身」のレートが大きく変わっている可能性があります。結果的に、レート推定に大きな系統誤差が生じていても不思議ではありません。そこで、2016年版のfloodgate棋譜集の棋譜を前期（1～6月）と後期（7～12月）に分けて、それぞれ前回と同じ方法で最尤法によるレート推定を行いました。結果は記事の最後にまとめてあります。表記は前回のものと基本的に同じです。半期に分けて処理を行った結果、全体的に前期のレートは減少し

zu2 2017/02/19

リンク

将棋のルールは完璧か？：「最後の審判」が提起したこと : コンピュータ将棋基礎情報研究所

将棋は「二人零和有限確定完全情報ゲーム」であるとよく言われます。これは、「二人」で行い、勝ち（+1点）／負け（-1点）／引き分け（0点）の合計が「零和」で、手数が「有限」で、偶然の要素がなくて「確定」的で、相手の指し手が全て分かる「完全情報」のゲームであるということを意味しています。しかしながら、将棋の決着が勝ち／負け／引き分けに分類できるというのは本当でしょうか？　もし将棋のルールに不備があるとすると、その他の状況に陥る可能性が出てきます。その際に、例えば「両者勝ち」や「判定不能で永遠に続行」等ということになれば、「零和」や「有限」というのは成立しなくなります。あるいは「振り駒やじゃんけんで勝敗を決めよう」等ということになれば、「確定」や「完全情報」でもなくなります。あるいは「立会人らが話し合いで決める」等ということになれば、そもそも「二人」の話ではなくなってきます。もしかすると、将棋

zu2 2017/02/19

リンク

評価値という数値　１：一歩百点？ : コンピュータ将棋基礎情報研究所

コンピュータ将棋では局面の形勢を「評価値」という数値で表現します。将棋ソフトの指し手は評価値に基づいて決定され、また、検討や解析における形勢も評価値の“点数”として表示されます。今や評価値は、将棋ソフトの利用者にとって、とても身近な量になっていると言えるでしょう。もし将棋が完全解析できたとするならば、局面は勝ち・負け・引き分けの3つの値（ゲーム値）に分類できるはずです。しかしながら、現実には完全解析は不可能なため、局面を評価するのにゲーム値の推測値が用いられることになります。これが評価値です。先を全て見通すことができないということが前提となっているため、評価値には未確定な未来への展望が織り込まれています。評価値がゲーム値の近似値であるのならば、一見すると、ゲーム値に近い極端な値の評価関数が優れているように思えます。極論的には、ゲーム値と同じく評価値も-1、0、+1の3種類でいいのではな

zu2 2017/01/15

“通常、人間は比率尺度で形勢を判断しないからです”

リンク

イロレーティングの散歩道　５：境界による“搾取”の問題 : コンピュータ将棋基礎情報研究所

前回までは、「住人のレートに上限や下限が存在しない」と仮定した場合の議論をしてきました。結果として、イロレーティングの頑強性が明らかになり、システムの安定性が示されることになりました。今回は、これまでスキップしてきた境界に関する問題を考えます。あらかじめ結論について述べておくと、これまでの記事がイロレーティングの有効性を示唆するものであったのに対して、今回の記事ではイロレーティングの一つの問題点が提示されることになります。それ故、今回の記事の結論について言及する際には、仮定や条件などをよく確認された上で、くれぐれも慎重な取り扱いをお願いします。さて、前々回の記事「イロレーティングの散歩道　３：ゆらぎのある非理想世界」において導いたように、実力レート\[R_{e}\]のE君が、表示レート\[R_{W}\]の相手に勝つ確率は、\[P_{\lim}(R_{e}, R_{W}) = \int_

zu2 2016/11/14

リンク

スイス式競技会：WCSC一次予選を例として : コンピュータ将棋基礎情報研究所

2016年5月3日～5日に第26回世界コンピュータ将棋選手権（WCSC26）が開催されます。今回の選手権は、参加者も多く、また、出場ソフトの平均レベルも大きく向上していると見込まれることから、熾烈な争いになるのではないかと予想されています。とりわけ、一次予選は8つの勝ち抜け枠を39チーム（4月17日現在）が争うという構図になっており、また、その中には優勝候補も複数含まれることから、初日から全く息の抜けない状況になっています。世界コンピュータ将棋選手権（WCSC）は基本的に「スイス式」競技会であり、今回も一次予選からスイス式で争われることになります。今回は、WCSC一次予選を例としながら、スイス式について改めて考えてみたいと思います。競技大会において、どのような組み合わせで競技を行い、順位をつければよいのかというのは昔から運営者の頭を悩ませてきた問題です。順位付けというと反射的にソートの

zu2 2016/11/14

リンク

人間の値打ち　２：統計的判定基準 : コンピュータ将棋基礎情報研究所

前回の記事「人間の値打ち　１：不正判定における許容リスク」では、不正判定において許容できる“冤罪”のリスクが一般的にどのように決められるのかを解説し、人生を変えるほどの重大な処分を行う際のリスク許容量として、年間10万分の1という数字例を提示しました。今回は、リスク許容量が、例えば、年間10万分の1と与えられた時に、統計処理における判定基準（有意水準）がどのように求められるのかを考えます。統計学で何らかの判定をする場合には仮説検定を行うのが基本となります。ここで、仮説検定というのは「棄却したい仮説（帰無仮説）に基づいて観測データが説明できる確率を評価し、確率が十分に小さければ（有意水準以下なら）帰無仮説を棄却する」という判定方法です。具体的に、不正判定の場合には、不正の有無を判定したいので、不正がなく通常であると仮定した時（帰無仮説）の確率分布を最初に求めます（※必要なのは、通常時に

zu2 2016/11/14

リンク

人間の値打ち　１：不正判定における許容リスク : コンピュータ将棋基礎情報研究所

「人間の値打ち」というイタリア映画があります。タイトルの通り、“人間の値打ち”とは何かを観客に問いかけて考えさせる作品であり、リアルで多彩な人間心理を巧みな演出で描いている魅力的な映画です。原題の「Il capitale umano」（原作「Human Capital」）は“人的資本”と訳されるものであり、経済学において人間を労働力として見た時の資本として価値を表します。また、転じて、将来の所得の現在価値合計の期待値として、様々なリスク評価にも用いられています。 “人的資本”は、あくまでも人間の生産面での市場価値を表すものであり、個々の人間的な価値や命の値段とは別のものです。しかしながら、現実社会では、これらは複雑に絡み合って浸透し、もはや容易にほどけるものではなくなってしまっています。映画では、そのような現実が説得力を持って描かれています。さらに近年では、人工知能の技術発展により、様

zu2 2016/11/14

リンク

はてなブックマーク

タグ

ブックマーク / lfics81.techblog.jp (9)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス