タグ

Dwangoと学習に関するslay-tのブックマーク (2)

  • 画像から描き方を生成する強化学習システムSPIRALの追実装 - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

    DeepMindから発表された画像から描き方を生成する強化学習システム「SPIRAL」[1]をChainerRLを用いて実装した. 実装はGitHubレポジトリで公開している. SPIRALとは SPIRALは絵の画像から描き方を生成するためのシステムである. 画像生成といえばDeep Convolutional Generative Adversarial Network(DCGAN [2])が主な手法だが,DCGANはラスター画像を生成するのに対して,SPIRALは時系列の描画行動,つまりベクター形式で画像を生成することができる. ベクター形式の画像はラスター形式とは異なり特定の線を取り除くといった編集を簡単に行うことができる. ベクター画像を生成するモデルとしてはSketch-rnn [3]があるが,このモデルは学習に描画過程,つまりベクター形式のデータが大量に必要になる. これらに

    画像から描き方を生成する強化学習システムSPIRALの追実装 - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
  • Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

    半荘をとおしてNAGAが出力した打牌時の確信度(後述)をプロットした結果のグラフです。 グラフのポイントを選択するとその際の局面が表示され、打牌の分布とその理由などの情報を確認できます。ぜひ試してみてください。 なお、終局時の確信度は0になっています。 概要DMVでは麻雀AIの作成に取り組み、麻雀の高段位者の牌譜から、打牌の選択、副露の選択などを深層学習することで麻雀AI NAGA(Neural Architectural Game Agent, Twitterアカウント)を作成しました。 そして、オンライン対戦麻雀天鳳において最高八段を達成しました。稿では、深層学習により強い麻雀AIを作成するために行ってきた取り組みについて紹介いたします。 麻雀麻雀は相手の手牌が見えず(不完全情報)、次にどの牌を引くのかわからない(不確定)という難しさのあるゲームです。 プレイヤーが4人のため次の自分

    Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
  • 1