[B! ai][強化学習] pongepongeのブックマーク

pongeponge id:pongeponge

aiと強化学習に関するpongepongeのブックマーク (2)

AlphaGo Zeroの論文の要約 : ブログ
Alpha Go Zeroが自己学習のみで過去最強になったというニュースが出たのでその元論文を読み、要約をしました。まず感想を述べると、過去数千年にわたって蓄積してきた知識をAIが数時間で発見することに対する気持ち良さがありました。人間などクソ食らえと思っておりますので、こう言うニュースはとてもスッキリします。そして人間の発見していない打ち筋の発見にも感動しました。これこそがAIの真髄だと信じています。人間が見えていないものをAIが見つける、僕もいつかそんなことをしてみたいと思いながら生きています。あともう一つ重要だと思ったのは、とてもネットワーク構造および学習過程が簡素化されたことです。マシンパワーも過去に比べて非常に少なく済み、個人でもすぐに再現実験ができそうなくらいです。AIが強くなることと、構造および学習のsimplerが同時に達成できていることが本質的だと思います。一応、下記
pongeponge 2017/10/21
いろんな木の探索方法があるんだなぁ

機械学習

AI

人工知能

Google

Deep Learning

google

ai

強化学習

AlphaGo
リンク
「ＡｌｐｈａＧｏ」が進化囲碁の打ち手教えずに従来型破る | NHKニュース
囲碁のトップ棋士に勝った人工知能「ＡｌｐｈａＧｏ」が進化し、打ち手を全く教えずに白紙の状態から学習して従来型の人工知能を破ったと開発した会社が発表し、人工知能はもはや人間の知識に制約されなくなったとしています。この会社が開発した人工知能「ＡｌｐｈａＧｏ」は、囲碁の名人の打ち手のデータを基に学習を重ね、ことし世界最強とされる中国のトップ棋士を破り、大きな話題となりました。今回、新たに開発した「ＡｌｐｈａＧｏＺｅｒｏ」は答えを導くデータがなくても、人工知能がみずから試行錯誤を繰り返して、よりよい答えにたどり着く、「強化学習」という手法を取り入れたということです。そして、囲碁の基本ルール以外には何も教えず、わずか３日間で５００万回の対戦をひとりでに繰り返して強さを身につけた結果、トップ棋士を破った従来型の人工知能に圧勝したということです。さらに、新型の人工知能は白紙の状態から学習する中で
pongeponge 2017/10/19
短時間でアホほど試合回数こなせるのは機械の強みだよなぁ/そろそろ「白なのに黒打ってた」とか「煽ったら激昂して殴りかかってきた」「飽きたから大富豪しようぜと突然言われた」を学習させよう

人工知能

囲碁

強化学習

science

技術

システム

AI

テクノロジー

ゲーム
リンク
1