タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

hadoopに関するtsucchi1022のブックマーク (2)

  • Hadoopとscribedの組合せ・2011年夏 - たごもりすメモ

    Hadoopクラスタを組み直す機会がやってくるのでこの際だからHadoopのバージョンを上げるべくあれこれテスト中。で、それにあわせて scribed のビルドもやったのでせっかくだから記録を残しておく。 なお以前(2011年当初)の状況については以下のエントリを参照のこと。 scribedのセットアップ手順ひと通り(hdfs書き込み有効版) - tagomorisのメモ置き場 Hadoop(libhdfs)各バージョンとscribeの微妙な関係 - tagomorisのメモ置き場 手順などについては上記エントリを起こしたときのものから変わってないので再掲はしない。そちらを参照のこと。 各ソフトウェアのバージョンについて 以前調べたときは CDH3b3 使えねえ!ということになっていたが、既に CDH3u1 が出ているのでそちらで試してみた、ら、使えた! やっほう! 現状のソフトウェア・ラ

    Hadoopとscribedの組合せ・2011年夏 - たごもりすメモ
  • Perl で MapReduce - Mahout Frequent Pattern Mining Data - - hamadakoichi blog

    最近、Perl も書き始めてみたので、Hadoop 上で分散実行できる Perl での MapReduce 実装を紹介する。大規模データマイニング・機械学習のライブラリ Apache Mahout の Parallel Frequent Pattern Mining の入力データを生成する Perl MapReduce 実装の紹介。 Frequent Pattern Mining 入門 Frequent Pattern Mining (Association Analysis )は、隠されたルールパターンを抽出するアルゴリズム。有名な例としては、1992年のウォルマートのクリスマス商戦で「おむつを買った人は半ダースのビールを買う可能性が最も高い」という頻出ルールを抽出し、商品陳列に活かした売上向上した事例。 入門資料: 第5回R勉強会@東京 で話してきた - 「R言語によるアソシエーション

    Perl で MapReduce - Mahout Frequent Pattern Mining Data - - hamadakoichi blog
  • 1