タグ

強化学習と技術に関するpongepongeのブックマーク (1)

  • 「AlphaGo」が進化 囲碁の打ち手教えずに従来型破る | NHKニュース

    囲碁のトップ棋士に勝った人工知能「AlphaGo」が進化し、打ち手を全く教えずに白紙の状態から学習して従来型の人工知能を破ったと開発した会社が発表し、人工知能はもはや人間の知識に制約されなくなったとしています。 この会社が開発した人工知能「AlphaGo」は、囲碁の名人の打ち手のデータを基に学習を重ね、ことし世界最強とされる中国のトップ棋士を破り、大きな話題となりました。 今回、新たに開発した「AlphaGoZero」は答えを導くデータがなくても、人工知能がみずから試行錯誤を繰り返して、よりよい答えにたどり着く、「強化学習」という手法を取り入れたということです。 そして、囲碁の基ルール以外には何も教えず、わずか3日間で500万回の対戦をひとりでに繰り返して強さを身につけた結果、トップ棋士を破った従来型の人工知能に圧勝したということです。 さらに、新型の人工知能は白紙の状態から学習する中で

    「AlphaGo」が進化 囲碁の打ち手教えずに従来型破る | NHKニュース
    pongeponge
    pongeponge 2017/10/19
    短時間でアホほど試合回数こなせるのは機械の強みだよなぁ/そろそろ「白なのに黒打ってた」とか「煽ったら激昂して殴りかかってきた」「飽きたから大富豪しようぜと突然言われた」を学習させよう
  • 1