タグ

2014年1月15日のブックマーク (3件)

  • Cloudera Manager + EC2 で Mahout を5分(ぐらい)で動かす - Qiita

    ゴール HadoopやMahoutはインストールから動く状態まで持っていくのに、慣れないうちは結構時間かかってしまいます。 しかし、これをさくっと終わらせることができます。 そう、Cloudera Managerならね。 さらにこれにEC2を組み合わせると、さらにさくっと終わらせることができます。 そんな訳で、今回はClouderaManager + EC2の組み合わせを利用して、まっさらな状態から Hadoopのインストール クラスタ構築 Mahoutのインストール デモ実行 までを5分(ぐらい)で終わらる手順を示したいと思います。 ※注 - サーバがEC2でなくても、大体似た感じでいけると思います - ほんとに5分(ぐらい)で終わるかどうかは、回線速度やサーバスペックによります。信じちゃいけません。 前提としている知識 EC2に関する基的な知識 Hadoopに関する基的な知識 ss

    Cloudera Manager + EC2 で Mahout を5分(ぐらい)で動かす - Qiita
  • TokibitoさんのHadoop資料の補足 | White scenery @showyou

    Hadoopとその周辺の紹介 – BPStudy http://t.co/ywmVJOmDth 上の資料、公開頂きありがとうございます。 個人的にここは違うのではないかというのが幾つかあったので書きます。自分が書くとこも怪しいかもしれないので後ろからshiumachiせんせーとかが援護することを期待します。 > P2: Hadoopとは 分散処理基盤 というより、 大規模並列処理基盤といった方が正しいかもしれません。あと大事なのは、Hadoopプロジェクト自体がGoogleMapReduceプロジェクトの模倣品といったところです。HDFSもGFSという分散ファイルシステムの模倣品だったはず。 > P3: HDFSとは > NameNode DataNode Hadoop 1.0(CDH3)までは大体正しいです(Secondary NameNodeが欠けてますが)。Hadoop 2.

  • Java EE 7

    JavaEE6.next() = JavaEE7 The Next Generation Platform! ‘Enriched’ JAX-RS 2.0, JPA 2.1, Servlet 3.1 and Bean Validation 1.1 ‘Revamped’ JMS 2.0 ‘Embracing HTML5’ with Web Sockets 1.0, JSON-P 1.0 and JSF 2.2 ‘Meeting Enterprise Demands’ with Batch Applications ‘Controlled Multi-Threading’ via Concurrency Utilities 1.0 ‘Tighter’ CDI 1.1

    Java EE 7