タグ

ブックマーク / yaneuraou.yaneu.com (24)

  • シンギュラリティ、もう来てない? | やねうら王 公式サイト

    2045年頃にシンギュラリティが起きると言われている。技術の進歩が予想以上に速いことから、これが早まる可能性があると考える研究者も多い。 私はシンギュラリティはもう来てるんじゃないかと思っている。今回はその根拠について少し書く。 岡谷貴之さんの『深層学習』(第二版)には「student gradient descent」という言葉が出てくる。ちなみに、このは第一版から大量にページが追加されて、第一版とは全く別の内容となっているので、第一版を買った人も是非第二版を手にとって欲しい。 さて、このように大学院生がランダムな思いつきを端から試すことで得られた深層学習のアイデアやテクニックやらがたくさんあるのが現在のこの界隈の状況である。 彼らは決してIQ 500のような超知能を持つわけではないが、彼らが試行錯誤することにより技術的な前進が得られているわけである。 つまり、シンギュラリティに必要な

    honeybe
    honeybe 2024/06/04
  • 将棋ソフトを開発して3000万円損した話 | やねうら王 公式サイト

    「大人の数トレチャンネル」(YouTube)に私が出演した時の後編の動画があまり再生回数が伸びてないので改めて紹介をさせていただく次第である。 このブログでも以前ちらっと書いた、「将棋ソフトを開発して3000万円損した話」が出てくる。(詳しい内容については動画をご覧いただきたい) それとは関係ないのだが、動画の内容に関連して、いくつか補足しておきたいことがある。 AI界隈では、「プロ棋士 VS 将棋AI」という構図が「人間 VS AI」の縮図だと言われることが多々ある。例えば、これは「将棋AIのようにAIが人間を打ち負かしたあとは、○○○な未来になっていく」みたいな文脈で用いられる。 しかし、人間が将棋AIに抵抗してきた歴史について当事者視点で語ってあるブログや書籍はあまりに少なく、そのへんの情報がまるで伝わっていないように思う。 そこで、記事では私が当事者視点でだらだらと書いていく。

    honeybe
    honeybe 2024/05/20
  • Winnyの金子さんのED法について | やねうら王 公式サイト

    Winnyの金子勇さんが考案された機械学習アルゴリズムED法を再現して実装した人がいていま話題になっている。 『Winny』の金子勇さんの失われたED法を求めて…いたら見つかりました https://qiita.com/kanekanekaneko/items/901ee2837401750dfdad いまから書くことは私の記憶頼りなので間違ってたらコメント欄で教えて欲しい。 1998年ごろだと思うのだが、私はWinnyの金子勇さんのホームページの熱心な読者だった。(ページも全部保存してたので私のHDDを漁れば出てくると思うが、すぐには出せない。) Winnyのβ版が発表されたのが2002年なのでそれよりはずいぶん前である。 当時、金子さんはNekoFightという3D格闘ゲームを公開されていた。そのゲームには、自動的に対戦から学習するAIが搭載されていた。 当時の金子さんのホームページの

    honeybe
    honeybe 2024/04/22
  • プロ棋士は将棋ソフトが無くても困らないのか? | やねうら王 公式サイト

    将棋AI界隈に対して、熱量の高い将棋ファンからよくわからない敵意を向けられることがある。 「長い将棋歴史のなかで、将棋ソフトなんか無い時代からプロ棋士は脈々と将棋技術を研鑽してきた。将棋ソフトなんてプロ棋士には全く不要で無くても何も困らない。将棋ソフトは将棋界に寄生するだけの寄生虫の癖にその開発者は偉そうにすんな。」みたいな意見である。 この世から将棋ソフト(将棋AI)がすべて無くなった世界と、いまの世界とを比較するならば、「将棋ソフトが無くてもプロ棋士は困らない」には私も同意する。将棋界はいままでそうして命脈を保ち、歩んできたのだから。 しかし、将棋ソフトは誕生してしまった。誰かが、トッププロより強い将棋ソフトを生み出してしまった。(その経緯についてはここで触れない。) そうすると、将棋ソフトを活用しているプロと活用してないプロとの差が生じる。そして、少しでも速いパソコンで将棋ソフト

    honeybe
    honeybe 2024/01/04
  • 羽生先生の発言は何が開発者の反発を招いたのか? | やねうら王 公式サイト

    2つ前の投稿で羽生先生のインタビュー記事の発言を取り上げたらプチ炎上しました。私は特に炎上を狙ってやっているわけではなく、羽生先生の発言が将棋AI界隈に悪い影響が残り兼ねないので書いたのですが、開発関係者からは一定の同意が得られたものの、将棋ファンからは殺害予告やら、こんなツイートやらが届く始末です。 まあ、一線を越えているものに関しては関係各所と連携しつつ、粛々と対応させていただく次第です。(念のために言っておきますと、将棋ファンのすべてがこういう人たちばかりだとは私は思っていません。極一部にちょっとややこしい人がいらっしゃるという認識です。) この記事は大変長くなるので、「最新版のやねうら王が(お金を出してでも)欲しい!」と言う方や、「やねうら王の開発に支援してやる!」と言う方は、とりあえず、この記事の末尾のリンクから御支援くださいませ。 今回は、前回の羽生先生の発言を再度取り上げ、何

    honeybe
    honeybe 2024/01/01
  • サンタ逃亡のお知らせ | やねうら王 公式サイト

    毎年、やねうら王プロジェクトでは、クリスマスシーズンになると何かしらのプレゼントを行ってきました。詰将棋問題集100万問であったり、やねうら王のメジャーバージョンのリリースであったり、教師用データセットの公開であったり。今年は、最新版であるやねうら王V8.00をクリスマスに公開しようと準備を粛々と進めてきました。 そんななか、とても心を抉られる記事を目にしました。羽生先生のインタビュー記事です。 将棋をこよなく愛する開発者のみなさんは、将棋ソフトの開発で稼ごうと思っている人たちが少ないのです。 そのため、開発したプログラムを自分のスキルを披露する場として捉えて公開し、私たちが将棋AIを使うためのアプリも無償で公開してくれています。 <a href="https://www.kumon.ne.jp/kumonnow/obog/100_1/" target="_blank" rel="noop

    honeybe
    honeybe 2023/12/26
  • その打ち歩詰めの定義、間違ってません? | やねうら王 公式サイト

    まず、「◯◯角不成」となる1手詰め問題が作れるかについて考えてもらいたい。普通に考えると、(1手詰めで)例えば5二角不成で詰むなら、5二角成でも詰むはずであって、5二角不成でなければならないという状況は考えられない。ところが、それに挑戦する非常に面白い詰将棋問題が出題された。 いろいろあってやり場が無くなったのでここにあげておきます。良かったら解いてやってください。一手です。 https://t.co/IYB5Qx5dKv pic.twitter.com/hER6oCsK0y — Tonkatu (@tonkatu_love33) November 10, 2023 作意としては、68角不成。対して、77歩のあと、先手に合法手がない。つまり、歩を打つことで相手を合法手のない状態にしているので、これは打ち歩詰めであり、77歩は禁じ手であると言うのだ。(68角不成に代えて68角成だと、77歩の

    honeybe
    honeybe 2023/11/16
  • オセロの必勝法が見つかった件 | やねうら王 公式サイト

    すごいニュースが飛び込んできた。オセロの必勝法が見つかったのだ。正確に言うとオセロが弱解決された。まずはその論文を紹介する。 Othello is Solved : https://arxiv.org/abs/2310.19387 「弱解決(weakly solved)」を簡単に言うと、初期局面からの双方最善手を打つ時の結論(勝敗)がわかったと言う意味である。8×8のオセロの結論は引き分けなのだそうだ。「必勝法が見つかった」と記事のタイトルで書いたが、その結果として双方最善を尽くした時のオセロの結論が引き分けだったことが判明したので正しくは「必勝法(必ず勝てる方法)が存在しないことが証明された」とでも言うべきか。 今回は、初期局面から到達できるあらゆる局面についての結論(勝敗)がわかったわけではない。こちらは「強解決(strongly solved)」と呼ばれる。 弱解決と強解決とでは、

    honeybe
    honeybe 2023/11/07
    「正しくは「必勝法(必ず勝てる方法)が存在しないことが証明された」とでも言うべき」 / なるほどわからん
  • 角換りは終わったのかについて1万文字程度で | やねうら王 公式サイト

    先月のゴールデンウィークに行われた第33回世界コンピュータ将棋選手権(WCSC33)で弊やねうら王チームが準優勝したあと(この準優勝は当に準優勝であって、ビールにおつまみで乾杯するという意味ではない)、角換りという戦型について以下のツイートをした。 角交換と言う戦型が終わった。 1886局面の指し手を覚えるだけで先手側は公開されてる水匠(探索局面数は1億までの任意)に対して評価値+300に出来ることが証明された。 大会で上位のソフトは+300から逆転は97%ぐらいありえないので(手数で引分はある)つまりは将棋AIの世界では角交換の後手は必敗。 — やねうら王 (@yaneuraou) May 8, 2023 この前者のツイートにはインプレッションが172万もあり、Yahooニュースや朝日新聞デジタルなど多くのメディアで取り上げられた。 AIで角換わりが終わった? 藤井聡太竜王「こちらの立

    honeybe
    honeybe 2023/06/03
  • 先日の電竜戦、長時間マッチで現れたやねうら王のバグについて | やねうら王 公式サイト

    二日前に電竜戦 dlshogiと水匠の長時間マッチが開催された。 最高峰将棋AIによる長時間対局、プロ棋士3名が解説 : https://yaneuraou.yaneu.com/2021/08/03/long-time-game-by-the-best-shogi-ai/ イベント的には大成功で、多くのニュースメディアでも取り上げていただいたようである。 水匠のバグについて さて、その1局目で水匠がバグと思わしき読み筋が現れた。成れないところに飛車を成るというものだ。水匠の読みの錯覚であり、それによって大きく形勢を損ねて敗北を喫した。 水匠 vs dlshogi、先手番をともに制す(コンピュータ将棋協会blog) : http://blog.computer-shogi.org/denryu-sen_channel_opening-matches_and_conference/ 水匠の探索

    honeybe
    honeybe 2021/08/18
  • WCSC31、やねうら王のマシントラブルについて詳しく | やねうら王 公式サイト

    WCSC31(第31回世界コンピュータ将棋選手権)、二次予選、やねうら王は予選敗退しました。 やねうら王は、初戦で昨年末の電竜戦で優勝したdlshogiを後手番で下し、次にHEROZの計算資源をふんだんに使えるという噂のPALも同じく後手番で下し、私は気持ちよくお昼寝して起きたら、そのあと連敗してました😅 どうやらAWSのp4インスタンスのメモリ1.1TBを使い切って、コンソールから応答返ってこなくなったらしいです。nps(探索速度)が家dlshogiより出るように頑張ったのに、それが仇となって、1.1TBのメモリを使い切って死ぬとは。 第2局でも終盤で4秒ぐらいで指すはずのところで大長考をしているので(コンソールからの応答もなし)、よく第2局で勝てたなという感じ。 そのあと私はお昼寝してたんですけど、フリーズすると困るのでオペレーション担当のMizarさんは、やねうら王を以前の探索部

    honeybe
    honeybe 2021/05/05
  • 【連載】評価関数を作ってみよう!その1 | やねうら王 公式サイト

    将棋AIと言えば、探索と評価関数で構成されています。探索と評価関数が車輪の両輪のようなもので、その2つがうまく合わさって初めて強い将棋AIが完成します。 ところが、やねうら王系の最新の評価関数であるNNUEは浅い層からなるニューラルネットを採用しているので、新たに将棋ソフトを作ろうと始めた人がいきなりNNUEの実装をやろうとすると普通、挫折します。 そもそも評価関数が完成してもパラメーターが多すぎるので機械学習によってチューニングせねばなりません。機械学習を行うには、教師データが必要で、将棋AIの場合、自己対局により教師データを生成してそれを用いるのですが、そのためには大量の計算資源が必要になります。あと強化学習をするためのコードを書かないといけません。機械学習の理論を学ばなければなりません。 そのように、ちょっと中高校生ぐらいの人がご家庭のPC趣味将棋ソフトを作ろうと思った時に、いき

    honeybe
    honeybe 2020/11/20
  • 新感覚の将棋ソフト『たけわらべ』を期間限定で公開します | やねうら王 公式サイト

    竹部さゆり女流プロデュースの新感覚の将棋ソフト『たけわらべ』を期間限定で公開します。 なんと!評価関数ファイルはありません。 体だけ将棋所かShogiGUIに登録すればすぐに遊べます。 (エンジンオプション等は、やねうら王と同じです。) 現代の最新の将棋ソフトには到底敵いませんが、人間相手だとわりと強いです。 ・KPPT型のように形に対する評価を一切持っていない。 ・利きがすべて。利きだけで盤面を制圧する将棋。 ・見たことのない囲いが頻出する。人間は初見で対応するのは難しい。 ・囲いに対する知識は一切持っていない。 次の画面の後手が「たけわらべ」です。 何この囲い…何この攻め…何これ。こんな将棋負けるのか…なんだこれ。将棋って何…。 みたいなやられ方をします🤮 次の画面も後手が「たけわらべ」です。囲いも攻めも独創的すぎて笑えます。 田舎将棋の強いおっさん(定跡書も何も読んだことがない

    honeybe
    honeybe 2020/11/18
  • 強化学習用の教師生成時のランダムムーブについて | やねうら王 公式サイト

    将棋AIの強化学習では自己対局を用いるが、その時に同一の棋譜ができてしまわないように何らかの工夫が必要である。 1) floodgateのような大量の実戦棋譜の任意の局面から開始する 2) 定跡を用意して、ランダムに定跡を採択する 3) 初手から数手、ランダムムーブを入れる 4) 序盤では最善手と評価値(or 期待勝率)がさほど離れていない指し手のなかからランダムに選択する 2016年~2017年ごろのやねうら王は、人間の棋譜を用いないということにこだわっていたので3)にしていた。いまどきの主流が1)なのか2)なのかは知らないが、AlphaZeroに影響を受けている人は4)が多いように思う。2018年は1)を試してみた。そちらのほうが少し強くなった。 それで、これに関して、なんとかちゃんねるに気になる投稿があったので引用する。 634名無し名人 (ワッチョイ 0234-3XbD)2020/

    honeybe
    honeybe 2020/10/29
  • 読み筋が合流するのに評価値が違う件 | やねうら王 公式サイト

    AbemaTVの放送で、AIの出力する候補手1と2の読み筋が途中で合流して同じ局面になるはずなのに評価値が1と2で異なるという状況があったらしく、それを解説していたプロの先生が「これはおかしいですね」とか何とかおっしゃっていたそうなのですが、これについて解説します。 やねうら王を始めとするいまどきの将棋ソフトの思考エンジンは、複数の候補手を出力するMultiPVという機能があります。AbemaTVの思考エンジンもこのMultiPVを用いて出力しているのだと思われます。 予測される状況1 ところが、AbemaTVのSHOGI AIでは、複数エンジンの評価値を組み合わせて期待勝率を出しているようです。 なので、 ・エンジン1が、候補手A,B,C ・エンジン2が、候補手A,C,D ・エンジン3が、候補手A,C,D のように候補手を出力した場合、候補手Aは、3つのエンジン(が候補手Aを指した時)の

    honeybe
    honeybe 2020/10/29
  • 将棋AIの棋力計測、こんな方法は駄目だぞ | やねうら王 公式サイト

    A1vsA2のレート差をΔa1、A2vsA3のレート差をΔa2としたとき、A1vsA2 A2vsA3 A3vsA4 … An-1 vs Anとして計測し、累積したΣΔaと、A1vsAnのレート差Δ(1 vs n)ではΣΔaのほうでレートインフレが起こり、どうやらΣΔa >> Δ(1 vs n)となるらしいことがわかりました。 — 将棋ソフト「mEssiah」公式 (@messiah_ai) July 4, 2020 そこで数学有識者のみなさんのお知恵をお貸しいただきたいのですが、ΣΔa ≒ Δ(1 vs n)となるようにΣΔaのインフレを補正できる方法が何かないでしょうか? — 将棋ソフト「mEssiah」公式 (@messiah_ai) July 4, 2020 要するに、将棋ソフトAとBでは、BのほうがR50強かった。BとCではCのほうがR30強かった。AとCとではR50+R30=R8

    honeybe
    honeybe 2020/07/07
  • 機械学習エンジニアのための将棋AI開発入門その2 | やねうら王 公式サイト

    前回の続き。将棋AIで最初に大規模機械学習に成功させたBonanzaの開発者である保木さんのインタビューがちょうどYahoo!ニュースのトップ記事として掲載されたところなので、今回はBonanzaの機械学習について数学的な観点から解説してみたいと思います。 Bonanzaの保木さんのインタビュー記事 プロ棋士に迫ったAI「Bonanza」 保木邦仁「将棋を知らないから作れた」 https://news.yahoo.co.jp/feature/1712 BonanzaのGPW発表スライド とは言え、Bonanzaで使われている機械学習の技法は、いまどきの機械学習とは少し毛色が異なるので心の準備が必要です。 まず、保木さんのGPW(ゲームプログラミングワークショップ)での発表スライド、以前はBonanzaの公式サイトからダウンロードできたのですが、Bonanzaの公式サイトがジオシティーズにあ

    honeybe
    honeybe 2020/06/02
  • dlshogi強すぎクソワロタ | やねうら王 公式サイト

    AlphaZeroの再現実験として、YSSの山下さん、Bonanzaの保木さん、Ray(囲碁ソフト)の小林祐樹さんのゴールデンコンビがタッグを組んだAobaZeroというソフトがあるのですが、ここ最近は棋力が停滞気味であります。 http://www.yss-aya.com/aobazero/ 対して、AlphaZeroのようにDeep Learningを用いている将棋ソフトではあるものの、山岡忠夫さんのdlshogiのほうは、AlphaZeroの再現にはこだわってないようで、C++で高速化したり、終盤用にdf-pnによる詰将棋ルーチンを搭載したり、LeelaChessZero(AlphaZero型のオープンソースのChessのソフト)の改良点を取り込んだり、TensorRTを用いた高速化を行うなど、様々な改良を意欲的にされていて、ずいぶん強くなっているようです。 将棋AIの進捗 その42

    honeybe
    honeybe 2020/04/22
  • やねうら王公式による定跡掘削代行はじめました | やねうら王 公式サイト

    テラショック定跡の生成部を公開したので、一般ユーザーの皆さんがコマンドを叩けば自動的にかつ効率的に掘れるようになりました。 普通、人間が手動で定跡を検討する場合、将棋所などの検討モードを用いて1つの局面を複数スレッドで探索させるのが普通かと思います。しかし、探索はスレッド数の平方根ぐらいしか実効(実際の効率)がでないので、16スレッド用いても4スレッド分の働きしかしません。3/4の計算資源は無駄になってしまうということです。16スレッド用いるのならば16局面用意して、各スレッドがそれぞれの局面を探索するのが一番効率が良いわけです。これを行えるのが、やねうら王の定跡生成コマンドです。(“makebook think”コマンドなど) そんなわけで、やねうら王の定跡生成コマンドを使うだけで、手動で1局面ずつ検討させるより、はるかに高い効率で検討が行えます。しかしご家庭のPCでやる場合、例えば8ス

    honeybe
    honeybe 2019/05/29
  • 3年以上誰も発見できなかった探索部のbugがRustによって見つかったという話 | やねうら王 公式サイト

    だいたいにおいて、やねうら王ほどメジャーな将棋ソフトの探索部に大きなバグを埋め込むことは常識的に考えると不可能である。多くの人が改良に参加している&参考にしているので、誰かの目に止まるはずではある。ところが、公開後、数年も誰も気づかなかったbugがつい先日見つかった。Aperyの平岡さんが、AperyをRustで書き直している時にRustのコンパイラが警告を出したので気づいたと言うのだ。(WCSC29の会場で平岡さんから直接教えてもらった。) bugの詳しい内容 ここから少し専門的な話が出てくる。プログラマでない人は次の見出しまで読み飛ばすこと推奨。 – Position::move16_to_move()のbug fix。thx.平岡さん https://github.com/yaneurao/YaneuraOu/commit/9e6ba09029839838e10cd928456935

    honeybe
    honeybe 2019/05/26