ブックマーク / gma0bn.hatenablog.com (9)

  • 問題提起するわ - 思うだけで学ばない日記 2.0

    問題提起するわ xxx.....■■........._.■■■■■■■ xxxx■x■xx■ ■■■■ ■ ■■■■ xxx.....■■■■■........._.■■■■■■■■■■■■■■■■■■■ ■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■ ■■x■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■ ■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■ ■■■■■■■■ ■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■ ■■■■■■■■■■■■■■■■■■■■■■ ■ 問題提起 [既存のコンピュータ将棋] (特徴) 1. 優れたプレイヤー同士の棋譜を学習サンプルとする。 2. 学習サンプルで評価関数を調整する。 3. 2で調整した評価関数をそのまま

    問題提起するわ - 思うだけで学ばない日記 2.0
    zu2
    zu2 2018/01/23
  • うおォン 俺はまるで人間コンピューター将棋だ - 思うだけで学ばない日記 2.0

    置換表の[lower, upper]と探索窓[α, β)が共通部分を持つが互いに包含関係にない場合でなおかつαに根拠が無い場合の正しい取り扱い方がやっとわかった! このタイミングで!! 今更杉でチョー恥ずかしい木もするが、置換表の問題が今度こそ永久解決した以上、このGMA0BN逃げも隠れもせぬわ!!! が、キャンセルはするかも…; … …

    うおォン 俺はまるで人間コンピューター将棋だ - 思うだけで学ばない日記 2.0
    zu2
    zu2 2015/05/02
    うおォン 俺はまるで人間コンピューター将棋だ - 思うだけで学ばない日記
  • 極私的電王戦まとめメモ - 思うだけで学ばない日記 2.0

    電王戦スレ273より*1 471 名前: 名無し名人 [sage] 投稿日: 2014/03/30(日) 00:06:41.71 id:aK8dTWU5 >>437 水平線に持ち込めるソフトの癖ならプロ棋士の記憶力をもって1000局もやれば掴めるんジャネ 具体的には、プロ棋士の目から見てソフト劣勢なのに高めの評価値がつくパターンを収集すれば良い たとえば相手の居玉に対して、ソフトは200 cpほど高い点数をつけ、積極的に攻めてくるそうな (うまくあしらえばソフトに無理攻めを遂行させることができる) 482 名前: 471 [sage] 投稿日: 2014/03/30(日) 00:08:44.94 id:O995Xx/o そもそも対局後のインタビューで豊島九段は (1000局といっても)投了まで指していないのがほとんど、みたいなことを言っていたのは 評価値の挙動とプロの大局観の突合せ作業をし

    極私的電王戦まとめメモ - 思うだけで学ばない日記 2.0
    zu2
    zu2 2014/04/10
  • クラスタの手帳(3) - 思うだけで学ばない日記 2.0

    並列探索が完成すた、 休み休みショボい探索を続ける以前作った並列探索(もどき)に比べて4コア8+1スレッドのハードビジー状態は圧巻 ならびに探索結果もシングルスレッドでやった結果とぴったり一致するし*1大変気分がよろしい 今回のやつはカナーリ綿密に検証したし*2、CPUがブン回っているのだからさぞかし高速化されたことだろうと速度を計ったら8倍にせまるいきおい …8倍…だと…? よく考えたらこれは当然で、並列探索を切るとマスターが単独で探索するのだがマスターにはいろいろゴテゴテ処理がついてるので… 正しくはシングルスレッドのスレーブと比較すべきなのだがめんどくさいから良いや、 再探索がどれぐらいの割合で起きているのかは黙して語らず*3 追記 8倍というのはいくらなんでもアレすぎるんじゃ…と思って調べたら原因があった、 マスターのβカットがOFFのままになっており、マスターがαβでなくてミニマ

    クラスタの手帳(3) - 思うだけで学ばない日記 2.0
    zu2
    zu2 2013/01/29
  • クラスタの手帖 - 思うだけで学ばない日記 2.0

    一昨日のエントリは見ようによっては不思議なことが書いてあると思われる人もいるかもしれない 置換表のエントリの正当性と、並列探索(に関するNB0AMG法)における辞書の正当性とが別物の法則によって支配される、というくだりのことだる その人はこう考えるに違いない: 置換表と並列探索の辞書の違いは窓がクリーンかダーティーかの違いだけ。一方、探索木とその葉における評価値を指定したらプレイヤーA,B双方の最適戦略の組み合わせとしての読み筋の集合と、その結果としての評価値が一意に定まる。つまり木と評価関数を指定するだけで求める情報(読み筋と評価値*1)は定まっており、置換表または辞書に載るべき正解のどこにもαβウィンドウが関与しないではないか!置換表と並列探索の辞書とで、扱いに違いなんて出ないんジャネーノ?GMA0BNはしょせん言うこと成すことGMA0BNクォリティーだな! ところが、教科書的なαβ

    クラスタの手帖 - 思うだけで学ばない日記 2.0
    zu2
    zu2 2013/01/19
  • GMA0BNでもわかるNarrow window - 思うだけで学ばない日記 2.0

    1 まず、アルファベータ法におけるαβウィンドウの挙動を復習汁、 いま当方手番ノード(●)以下の探索を、αβウィンドウ[α, β)の下で始めたとすると、事態は次のステップで推移せり ●が探索の末端(探索木の葉)ならば、局面評価値を計算してそれを返して終わる。[RETURN] さもなくば、置換表でも引いてみて、エントリにHitした場合、 fail-Highだったりfail-lowだったりしたらそれはそれでその値を返して終わる[RETURN] どちらでもない場合は、可能な限り置換表に記録されているlower boundとupper boundに従いαβウィンドウを縮小して次に進む 縮小した場合は縮小後のαβウィンドウを改めて[α, β)と置こう 縮小した結果α=βになった(●のミニマックス値判明)ならαを返して終わる。[RETURN] 子ノードを列挙する*1 このときα値を増大方向に更新もする

    GMA0BNでもわかるNarrow window - 思うだけで学ばない日記 2.0
    zu2
    zu2 2012/02/03
  • 置換表は反復深化と組み合わせると一層不安定化する…国家も同じだ - 思うだけで学ばない日記 2.0

    何ていうーか、一昨日のエントリは、反復深化の際、置換表を成長するままに放置すると置換表に矛盾が生じることがあるという最終結論には修正の必要は認められないものの、途中の論理が例によって怪しさ炸裂だったorz 1 まず、T'がβカットされないときtが置換表に積まれるとしたのは全くの誤りだる tを含む部分木T'がβカットされる、という事象には、tがトラバースされる場合と、されない場合がある。 前者は、例えばT'の中で最初にトラバースされる葉ノードがtである場合等。とにかく部分木だろうがなんだろうが、葉ノードが探索木全体の葉ノードの部分集合である木なら、アルファベータ法でβカットされる前に少なくとも1つの葉がトラバースされる。tがそれにあたる可能性はままあり、これがtのように最終的な読み筋から遠く隔たった局面であっても置換表に積まれる真の原因だる 2 もう一つの間違いは、葉ノードであるtが置換表に

    置換表は反復深化と組み合わせると一層不安定化する…国家も同じだ - 思うだけで学ばない日記 2.0
    zu2
    zu2 2011/11/16
    探索延長と組み合わせたときの動作はたしかにもやもやしてると思ってた。
  • 『もしドラ』はマジキチ(超意訳 - 思うだけで学ばない日記 2.0

    ライト読者 みなみと『マネジメント』との遭遇は、 転校初日に遅刻しかけた主人公が道の曲がり角でパン咥えて走ってきたヒロインと衝突してご対面、とか ミディアムブラックホールが太陽めがけてピンポイントクラッシュでまあビックリ、みたいな よくある王道パターンの一変種と解釈していたので、 その部分に必然性とリアリティーと説得力が欠如しているという指摘は斬新だと思いました しかし読み進めていくうちに、作者までもがそういった奇想天外な状況設定にも(書いてないけど)必然性が存在するのだ、 という見解であることが明らかとなり驚愕を禁じ得ません そもそも『もしドラ』はそのタイトルからして「もしAだったら」という奇想天外な状況設定は天与であって、 ただちにありえないと断言できるレベルでさえなければ良く、 むしろその設定を受けて続く部分が話の中身である、というように万人が解釈しそうなものですが これは作者の意

    『もしドラ』はマジキチ(超意訳 - 思うだけで学ばない日記 2.0
    zu2
    zu2 2011/08/22
  • 【すっきり】2^30通りの謎【解決篇】 - 思うだけで学ばない日記 2.0

    昨日のエントリはなんかgdgdになってたorz、、 誤:序盤30手 正:31手から90手までの片側30手 そして、「一致するのは10億局面に1回」という主張と、実際のソフト指し認定方法はあんまり関係が無い。前者は過去に指された一連の指し手との完全一致を問題にしているのに対し、後者はソフトと指し手が一致する頻度の高低を問題にしており、かつソフトは使うものの、最終決定に至るまでには24ソフト指し取締委員会による(つまり人間による)審議が一応はあるっぽい。つまり31手から90手までの片側30手の一連の指し手が既出かどうかの機械的判定でソフト指し認定されるわけではない。 ということを踏まえた上で、前者である「一致するのは10億局面に1回」という主張への猜疑に話を絞るが、30*2=60局面の中に候補手(=指す側にとって自己の利益を損ねないか、相手のミスを誘って増すように思える手)がn種類ある局面xが

    【すっきり】2^30通りの謎【解決篇】 - 思うだけで学ばない日記 2.0
    zu2
    zu2 2011/05/25
  • 1