タグ

機械学習に関するbijwagfuojfwのブックマーク (2)

  • 機械学習から考える人間学習  アンサンブル学習編|山本一成🚗TURING

    たくさんの台数のパソコンがあった時に、比較的簡単に将棋プログラムを強くする方法に「合議」という手法がある。合議というのは、複数のPCでそれぞれ独立に探索をさせて、その結果を多数決を取ったりなどする手法だ。これだけで一台のPCに対して、合議側が勝率6割〜7割に到達したりする。 一般に機械学習をしたものをさらに性能をあげる手法としては、アンサンブル学習というのがあります。今話した合議もアンサンブル学習の一種と言えそうです。ポイントは複数の機械学習の出力を"混ぜる"のですね。多数決で混ぜるのが一般的ですが、色々な手法があります。前に話したXGBoostもそれ自体、アンサンブル学習がベースになっています。 さて、このアンサンブル学習なぜうまくいくのでしょうか?といっても賢明な読者のみなさんはなんとなくわかると思います。現代社会において、投票行動がうまくいくと仮定していることと一緒です。みんなそれぞ

    機械学習から考える人間学習  アンサンブル学習編|山本一成🚗TURING
  • Alpha Zeroの衝撃と技術的失業|山本一成🚗TURING

    2016年、Google DeepMind社から恐ろしい論文が出された、AlphaGoその名を冠した囲碁プログラムが既存の囲碁ソフトに勝率99%を叩き出したのだ。AlphaGoは強化学習とDeep Learningを組み合わせた囲碁プログラムで、その年に最強の囲碁棋士の一人である李世ドルさんに4勝1負で勝利した。その後も進歩を続けて今のAlphaGoの強さは人類が体感できるレベルを超えるほど強くなったと予想される。 2017年も終わりのころ、Google DeepMind社からまた途方もない論文が発表された。囲碁とほぼ同じ手法で最強レベルのチェスや将棋プログラムを超えたということだった。実際のところ正確に超えたのかどうかちょっとだけ疑問もあるのだが、まず前提として彼らの新手法が途方もない成果をあげたこと素直に祝福したい。彼らは自分たちのプログラムをAlpha Zeroと名付けた。 コンピュ

    Alpha Zeroの衝撃と技術的失業|山本一成🚗TURING
  • 1