タグ

ブックマーク / note.com/issei_y (6)

  • 機械学習から考える人間学習  アンサンブル学習編|山本一成🚗TURING

    たくさんの台数のパソコンがあった時に、比較的簡単に将棋プログラムを強くする方法に「合議」という手法がある。合議というのは、複数のPCでそれぞれ独立に探索をさせて、その結果を多数決を取ったりなどする手法だ。これだけで一台のPCに対して、合議側が勝率6割〜7割に到達したりする。 一般に機械学習をしたものをさらに性能をあげる手法としては、アンサンブル学習というのがあります。今話した合議もアンサンブル学習の一種と言えそうです。ポイントは複数の機械学習の出力を"混ぜる"のですね。多数決で混ぜるのが一般的ですが、色々な手法があります。前に話したXGBoostもそれ自体、アンサンブル学習がベースになっています。 さて、このアンサンブル学習なぜうまくいくのでしょうか?といっても賢明な読者のみなさんはなんとなくわかると思います。現代社会において、投票行動がうまくいくと仮定していることと一緒です。みんなそれぞ

    機械学習から考える人間学習  アンサンブル学習編|山本一成🚗TURING
  • 人工知能するとプログラムは小さくなる|山本一成🚗TURING

    「Ponanzaってどれくらいの大きさのプログラム何ですか?」たまに聞かれる質問です。「私が一万行くらいです」と答えると、意外と小さいプログラムと思って、結構皆さんがっかり😞した顔をされたりするんですね。 確かにPonanzaよりも昔の時代の将棋プログラムはだいたい数万行を超えて居たようです。それが現代になるに従ってどんどん行数が減って来ています。なぜでしょうか? 実はPonanzaのソースコードのどこを探しても将棋の囲いや戦法あるいは手筋の情報は見つけられません。せいぜい王手は注意した方がいいよみたいな極めて基礎的な情報しか書いてません。それではどうしてPonanzaは将棋がで合理的なプレイができるのでしょうか?それは将棋の知識はすべてPonanza自身が機械学習によって習得しているからです。そしてその機械学習の結果はすべて数値データとして500MBくらいのバイナリファイルに保存されて

    人工知能するとプログラムは小さくなる|山本一成🚗TURING
  • 知能とは画像である|山本一成🚗TURING

    Deep Learningは現在様々な領域・分野で使われようとしている。しかし、もっとも安定的かつ強力に使える領域は、2018年2月現在、画像処理に関することと言ってもいいだろう。 静止画像から何が写っているかを当てる一般物体認識問題では、既存手法の性能を大きく超えるどころか、人間の認識能力すらも超えている。通常の画像に限らず、将棋や囲碁といった問題、果てには言語処理といった来は画像処理ではないと考えられていた問題ですら、現在は画像認識の問題に変換して Deep Leaningで解決し始めている。 突然なのだが、大学の授業や日々の業務でグラフを作成する人は多いだろう。我々が常日頃見ている画像、つまり眼に映る通常の映像、の縦軸と横軸は当然「距離」だ。ところがグラフを作る時の縦軸や横軸は金額や時間だったりと、もはや距離となんの関係もない。すでに完全に情報は揃っているのになぜ我々はグラフを作る

    知能とは画像である|山本一成🚗TURING
  • 将棋ウォーズにある史上最強に弱いPonanzaの話|山本一成🚗TURING

    自分が制作に関わっているスマホアプリに将棋ウォーズというゲームがある。オンライン対戦でたくさんのユーザーが毎晩将棋を指しており、最近になって合計対局数が3億対局を超えた。私の想像を遥かに超えるほど指されておりアプリ製作者としてはこれ以上にない喜びである。 しかし初心者にとってオンライン対局は決して気楽なものとは限らない。多くの強豪たちがオンラインの世界ではたくさんいるからである。そこで将棋ウォーズではオンライン対局とは別に練習対局というモードが実装されている。このモード、結構弱めで旧バージョンのPonanzaが搭載されており、ユーザと気軽に対戦できるようになってる。 Ponanzaの中でも「簡単」モードを選ぶと、史上最強に弱いPonanzaが選べる。このPonanzaこれ当に弱い。ここまで弱いプログラムがあるのかというくらい弱い。おそらくランダムに手を指すプログラムよりも弱い。 このPo

    将棋ウォーズにある史上最強に弱いPonanzaの話|山本一成🚗TURING
    synonymous
    synonymous 2018/01/23
    こうなってくると、Alpha Zero のほうがより上手に負けられるのかどうかが気になってくる。
  • Alpha Zeroの衝撃と技術的失業|山本一成🚗TURING

    2016年、Google DeepMind社から恐ろしい論文が出された、AlphaGoその名を冠した囲碁プログラムが既存の囲碁ソフトに勝率99%を叩き出したのだ。AlphaGoは強化学習とDeep Learningを組み合わせた囲碁プログラムで、その年に最強の囲碁棋士の一人である李世ドルさんに4勝1負で勝利した。その後も進歩を続けて今のAlphaGoの強さは人類が体感できるレベルを超えるほど強くなったと予想される。 2017年も終わりのころ、Google DeepMind社からまた途方もない論文が発表された。囲碁とほぼ同じ手法で最強レベルのチェスや将棋プログラムを超えたということだった。実際のところ正確に超えたのかどうかちょっとだけ疑問もあるのだが、まず前提として彼らの新手法が途方もない成果をあげたこと素直に祝福したい。彼らは自分たちのプログラムをAlpha Zeroと名付けた。 コンピュ

    Alpha Zeroの衝撃と技術的失業|山本一成🚗TURING
    synonymous
    synonymous 2018/01/23
    AI に慣れた私たちが AI を越えるパフォーマンスを発揮する日も近い。
  • この10年間のプログラミングの変化|山本一成🚗TURING

    はじめましてnoteの皆さん、名人を倒した将棋プログラムPonanzaというものを作っていた山一成と言います。この度ははてなから引っ越してきました。2018年になったので新しくブログ書いてみようかなぁ〜ってはじめました。 私がプログラミングをはじめたのは大学生だった時ちょうど10年前でした。そして今2018年になって、同じプログラミングにしても色々変わったなぁという印象です。今日はそのへんを皆さんと共有できたらなぁ〜と書きました。 あくまで私の観測範囲内での話をすればですけど、10年前のプログラミングの世界は速く動くことがかっこよかったです。実際にかっこいいだけでなく、必要とされる場面も多かったような気がします。私が愛用しているプログラミング言語はC++(シープラスプラス)と言って、まあそれは高速に動作することだけを意識して作られた言語でした。 加えて、今から考えれば一体なんでそんなトリ

    この10年間のプログラミングの変化|山本一成🚗TURING
    synonymous
    synonymous 2018/01/08
    分野によって濃淡がある感じだけど、何処も同じ方向ですなあ。
  • 1