タグ

apache_s4に関するgandenのブックマーク (2)

  • SAMOA by yahoo

    Scalable Advanced Massive Online Analysis View the Project on GitHub yahoo/samoa Download ZIP File Download TAR Ball View On GitHub SAMOA is a platform for mining on big data streams. It is a distributed streaming machine learning (ML) framework that contains a programing abstraction for distributed streaming ML algorithms. SAMOA enables development of new ML algorithms without dealing with the co

    SAMOA by yahoo
  • リアルタイム分散処理の常識をApache S4で身につける

    リアルタイム分散処理の常識をApache S4で身につける:ビッグデータ処理の常識をJavaで身につける(6)(1/2 ページ) Hadoopをはじめ、Java言語を使って構築されることが多い「ビッグデータ」処理のためのフレームワーク/ライブラリを紹介しながら、大量データを活用するための技術の常識を身に付けていく連載 Hadoopの弱点「リアルタイム分散処理」とは 「ビッグデータ」処理のためにHadoopを用いると、「複数のマシンに大量データ処理を分散して飛躍的に性能を向上する」ことが容易にできます。 ところがHadoopの弱点として、ビッグデータをいったん蓄積し、バッチで一括処理する形態で処理するので、処理データが発生してから、それに対する処理結果が得られるまで、必ずタイムラグが発生します。このため、クレジットカードの不正アクセス検知、センサデータなどでの異常値検出のようなリアルタイムな

    リアルタイム分散処理の常識をApache S4で身につける
  • 1