タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

ProgrammingとPRMLとShogiに関するagwのブックマーク (8)

  • 機械学習エンジニアのための将棋AI開発入門その2 | やねうら王 公式サイト

    前回の続き。将棋AIで最初に大規模機械学習に成功させたBonanzaの開発者である保木さんのインタビューがちょうどYahoo!ニュースのトップ記事として掲載されたところなので、今回はBonanzaの機械学習について数学的な観点から解説してみたいと思います。 Bonanzaの保木さんのインタビュー記事 プロ棋士に迫ったAI「Bonanza」 保木邦仁「将棋を知らないから作れた」 https://news.yahoo.co.jp/feature/1712 BonanzaのGPW発表スライド とは言え、Bonanzaで使われている機械学習の技法は、いまどきの機械学習とは少し毛色が異なるので心の準備が必要です。 まず、保木さんのGPW(ゲームプログラミングワークショップ)での発表スライド、以前はBonanzaの公式サイトからダウンロードできたのですが、Bonanzaの公式サイトがジオシティーズにあ

  • Ponanza開発者、山本一成氏が語る強化学習とA/Bテスト運用の舞台裏 | ログミーBusiness

    2019年1月28日、AWS Loft Tokyoにて「囲碁・将棋分野でのコンピューター活用の最前線〜あの天才女流棋士たちも活用するAWS〜」が開催されました。囲碁・将棋の世界では、コンピューターによる強化学習を取り入れた戦術研究が盛んになっています。そんな囲碁・将棋におけるAI活用の今について、現役棋士として活躍しながらAWSを利用して研究を行っている大橋拓文六段と、将棋プログラムPonanzaの作者である山一成氏が、自身の経験を踏まえて語ります。プレゼンテーション「Ponanza 強化学習とA/Bテスト運用」に登壇したのは、山一成氏。Ponanza開発の舞台裏と、用いられた技術について解説しました。 Ponanzaにおける強化学習とA/Bテスト運用山一成氏(以下、山):山一成と申します。よろしくお願いします。 ありがとうございます。ここからはややガチめなエンジニアの話です。ま

    Ponanza開発者、山本一成氏が語る強化学習とA/Bテスト運用の舞台裏 | ログミーBusiness
  • 近年のコンピュータ将棋の急速な伸びの理由は? | やねうら王 公式サイト

    表題の件を当事者視点で。 「近年のコンピュータ将棋の急速な伸びの理由は?」という問いの模範解答が分からない。(1年で200ほど伸びるようになった理由。) そこそこ聞かれる質問なので、答えを用意しておきたいのだが・・・ — Shota Chida (@mizumon_) July 14, 2016 理由をたったひとつ挙げるとしたら、2016年時点での最新の回答は「誰でも機械学習が出来るようになった」ではないかと思います。 従来、将棋ソフトの機械学習というのはBonanzaメソッド(通称ボナメソ)一択でした。激指はオンライン学習風の何かをやっていたのですけど、Bonanzaの3駒関係ほどパラメーターの数が多いと(数百万パラメーター)、オンライン学習ではうまくいかないと信じられていたので、誰もやっていませんでした。 ボナメソについて書かれた保木さんの論文自体、当時の将棋ソフト開発者には難解で(見

  • 将棋AIで定跡を作れるか試してみた - tokoharuの落書き帳

    UPD : 2016.12.16 : この記事の情報は古いのでより新しい情報をご覧ください 最近はやねうら王nano, nano-plus github.com が登場しており、自分のようにまじめに開発する気はそこまでないけどいじってみたい人には非常にうれしい状況です。 ということで定跡っぽいものを生成できないか試すことにしました やりかた 細かいことを説明するのは面倒なので雑に言います 下準備としてfloodgateから100局くらいそれっぽいのを持ってくる 定跡としてよさそうなところを定跡として、その各局面をやねうら王nanoに評価させる。(具体的には初手から30手までで数回以上出現した局面を抽出 指定局面から定跡をたどったりたどらなかったりしつついろんな局面を読む 新しく得られた局面とその評価値を定跡に書き込む, を繰り返す 今回の状況設定 nanoさんには各局面で8手読んでもらう

    将棋AIで定跡を作れるか試してみた - tokoharuの落書き帳
  • コンピュータ将棋について~機械学習を用いた局面学習への道~

    【DL輪読会】DiffRF: Rendering-guided 3D Radiance Field Diffusion [N. Muller+ CVPR2...

    コンピュータ将棋について~機械学習を用いた局面学習への道~
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • コンピュータ将棋の基礎知識

    この用語集の内容は無保証です。この用語集を信じて開発した将棋ソフトが 選手権で大敗しても、私は責任はもちませんし関知しません。あしからず コードや数式は極力書かず、読み物に徹しています。 ドーピング 自動学習でうまく行かない所や、データがないところを手動で補ってやる行為。語源は棚瀬さん? FutilityCut 探索中に残り1手の場合に、評価関数の値よりある程度alphaを下回っていれば、あと1手さらに指してもalphaを下回るだろうという予測の元にalphaカットとみなす。逆にある程度betaを上回っていると、あと1手指してもbetaを超えるだろうと予測してbetaカットする、といった後ろ向き枝狩り手法。評価関数の値の代わりに静止探索の値を用い、上回る定数幅をやや広げることで、残り2手の場合にも適用される。 KillerMove 探索中にベータを超えた良い手などを深さに応じて保持しておき

  • コンピュータと人。頭脳の対決。名勝負が続く将棋・電王戦(平林久和) - エキスパート - Yahoo!ニュース

    涙の引き分けプロ棋士とコンピュータの対決。将棋・電王戦。 4月13日、第4局が東京・千駄ケ谷の将棋会館で行われた。 今シリーズの対戦成績はプロ棋士が1勝、コンピュータが2勝。 塚田泰明九段が負ければ、団体戦五番勝負トータルでもプロ棋士側の敗北が決まってしまう。歴史的大一番だった。塚田九段の対戦相手は、昨年、故・米長邦雄将棋連盟会長に勝った「ボンクラーズ」の強化版、「Puella α(プエラアルファ)」。富士通研究所に所属する伊藤英紀氏が開発した。第21回世界コンピュータ将棋選手権で優勝したソフトだ。 対局開始から塚田九段に勝機は訪れなかった。悪手は一手も指していない。にもかかわらず、コンピュータ有利の局面が続いた。終盤には塚田九段が必敗の大勢になったが、粘りに粘って引き分けに持ち込んだ。王が敵陣まで進みあって、お互いに勝ちがない状態、持将棋となった。 230手の激しい戦いが終わり、観戦記者

    コンピュータと人。頭脳の対決。名勝負が続く将棋・電王戦(平林久和) - エキスパート - Yahoo!ニュース
  • 1