タグ

algorithmに関するnuraiのブックマーク (2)

  • MapReduceできる10個のアルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    HadoopとMahoutにより、ビッグデータでも機械学習を行うことができます。Mahoutで実装されている手法は、全て分散処理できるアルゴリズムということになります。Mahoutで実装されているアルゴリズムは、ここに列挙されています。論文としても、2006年に「Map-Reduce for Machine Learning on Multicore」としていくつかのアルゴリズムが紹介されています。 そこで今回は、(何番煎じか分かりませんが自分の理解のためにも)この論文で紹介されているアルゴリズムと、どうやって分散処理するのかを簡単にメモしておきたいと思います。計算するべき統計量が、summation form(足し算で表現できる形)になっているかどうかが、重要なポイントです。なってない場合は、”うまく”MapReduceの形にバラす必要があります。 ※例によって、間違いがあった場合は随時

    MapReduceできる10個のアルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • モンテカルロ法でサイコロ関数を検証 - harupiyoの日記

    モンテカルロ法をご存知でしょうか? 初めての方に、ちょっとだけ私から解説をさせてください! 例えば、サイコロの目。 サイコロを振って、今出た目が3、だったとしましょう。 この時、3が出た確率は(一回しか振ってないので)100% ですが、更に何回か振ると3以外の目が出て%は下がって行きますよね。 しかし、下がるとは言っても、サイコロですからそれぞれの出目の確率は1/6。最終的には1/6…約16% に落ち着いていくはずです。 振る回数が多いほど1/6 に近くなるというところがポイントで、このように一回の出目はランダムでも、たーーくさんの回数を稼いで期待する答えを導き出すという考え方がモンテカルロ法です。 実際にこれを確かめるPerl プログラムを書いてみました。 このプログラムでは、サイコロを振る関数dicing を、何回も(ENOUGH_MANY_TO_TRY回) 振ってみて、各出目の確率が

    モンテカルロ法でサイコロ関数を検証 - harupiyoの日記
    nurai
    nurai 2009/04/08
    サッパリわからん
  • 1