タグ

aiと強化学習に関するpongepongeのブックマーク (2)

  • AlphaGo Zeroの論文の要約 : ブログ

    AlphaGo Zeroが自己学習のみで過去最強になったというニュースが出たのでその元論文を読み、要約をしました。 まず感想を述べると、過去数千年にわたって蓄積してきた知識をAIが数時間で発見することに対する気持ち良さがありました。人間などクソらえと思っておりますので、こう言うニュースはとてもスッキリします。そして人間の発見していない打ち筋の発見にも感動しました。これこそがAIの真髄だと信じています。人間が見えていないものをAIが見つける、僕もいつかそんなことをしてみたいと思いながら生きています。 あともう一つ重要だと思ったのは、とてもネットワーク構造および学習過程が簡素化されたことです。マシンパワーも過去に比べて非常に少なく済み、個人でもすぐに再現実験ができそうなくらいです。AIが強くなることと、構造および学習のsimplerが同時に達成できていることが質的だと思います。 一応、下記

    AlphaGo Zeroの論文の要約 : ブログ
    pongeponge
    pongeponge 2017/10/21
    いろんな木の探索方法があるんだなぁ
  • 「AlphaGo」が進化 囲碁の打ち手教えずに従来型破る | NHKニュース

    囲碁のトップ棋士に勝った人工知能「AlphaGo」が進化し、打ち手を全く教えずに白紙の状態から学習して従来型の人工知能を破ったと開発した会社が発表し、人工知能はもはや人間の知識に制約されなくなったとしています。 この会社が開発した人工知能「AlphaGo」は、囲碁の名人の打ち手のデータを基に学習を重ね、ことし世界最強とされる中国のトップ棋士を破り、大きな話題となりました。 今回、新たに開発した「AlphaGoZero」は答えを導くデータがなくても、人工知能がみずから試行錯誤を繰り返して、よりよい答えにたどり着く、「強化学習」という手法を取り入れたということです。 そして、囲碁の基ルール以外には何も教えず、わずか3日間で500万回の対戦をひとりでに繰り返して強さを身につけた結果、トップ棋士を破った従来型の人工知能に圧勝したということです。 さらに、新型の人工知能は白紙の状態から学習する中で

    「AlphaGo」が進化 囲碁の打ち手教えずに従来型破る | NHKニュース
    pongeponge
    pongeponge 2017/10/19
    短時間でアホほど試合回数こなせるのは機械の強みだよなぁ/そろそろ「白なのに黒打ってた」とか「煽ったら激昂して殴りかかってきた」「飽きたから大富豪しようぜと突然言われた」を学習させよう
  • 1