タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

s4に関するmi_kattunのブックマーク (4)

  • リアルタイム分散処理の常識をApache S4で身につける

    リアルタイム分散処理の常識をApache S4で身につける:ビッグデータ処理の常識をJavaで身につける(6)(1/2 ページ) Hadoopをはじめ、Java言語を使って構築されることが多い「ビッグデータ」処理のためのフレームワーク/ライブラリを紹介しながら、大量データを活用するための技術の常識を身に付けていく連載 Hadoopの弱点「リアルタイム分散処理」とは 「ビッグデータ」処理のためにHadoopを用いると、「複数のマシンに大量データ処理を分散して飛躍的に性能を向上する」ことが容易にできます。 ところがHadoopの弱点として、ビッグデータをいったん蓄積し、バッチで一括処理する形態で処理するので、処理データが発生してから、それに対する処理結果が得られるまで、必ずタイムラグが発生します。このため、クレジットカードの不正アクセス検知、センサデータなどでの異常値検出のようなリアルタイムな

    リアルタイム分散処理の常識をApache S4で身につける
    mi_kattun
    mi_kattun 2012/05/07
  • Yahoo! Inc.製のストリームコンピューティングプラットフォーム·S4 MOONGIFT

    S4はYahoo! Inc.製の分散処理プラットフォーム。 [/s2If] S4はJava製のオープンソース・ソフトウェア。インターネット上には膨大なテキストコンテンツが存在する。さらにブログやソーシャルメディアを通じて刻々とデータ量は増大している。そうしたテキストコンテンツを解析し、意味を見いだしていくのが得意なのがMapReduceだ。 膨大なデータを細分化し、並列処理していくことで高速処理を可能にしている。今ではAmazon Web ServiceでAmazon Elastic MapReduceが提供されていたり、Yahoo! Inc.はHadoopの開発にも積極的に関わってきた。その次世代型とも言えるのがS4だ。 S4を開発し、公開したのもまたYahoo! Inc.だ。MapReduceの欠点として、予めプログラムを組みバッチ処理にしか使えなかったのだが、S4では適宜タスクとして

  • リアルタイムなHadoop? 「Real-Time MapReduce」を実現するS4、オープンソースとしてYahoo!が公開 - Publickey

    Yahoo!は、大規模データの分散処理を実現するMapReduceをリアルタイムに行うソフトウェア「S4」を、オープンソースとして公開しました。 MapReduceを実行するソフトウェアとして、オープンソースの「Hadoop」がありますが、Hadoopはあらかじめジョブを定義して投入するバッチ処理を前提としていました。 S4は、データをキーとバリューのペアで構成されるストリームデータとして非同期に受け取ることができ、処理結果もキーバリューのペアで構成されたストリームデータとして出力するようになっているとのこと。 この非同期なストリームデータによる入出力が、リアルタイムなMapReduceを実現するフレームワークとしてのS4の特徴といえます。 リアルタイムなMapReduceで何ができる? リアルタイムなMapReduceにはどのような用途が考えられるのでしょうか? S4の公開を表明したY

    リアルタイムなHadoop? 「Real-Time MapReduce」を実現するS4、オープンソースとしてYahoo!が公開 - Publickey
  • S4: Distributed Stream Computing Platform

    We've got your back )Buyer Protection ProgramWhen you buy a domain name at Dan.com, you’re automatically covered by our Buyer Protection Program. Our unique & carefully designed domain ownership transfer process is the best rated service in the market. Buyer Protection ProgramWhen you buy a domain name at Dan.com, you’re automatically covered by our unique Buyer Protection Program. Read more about

    S4: Distributed Stream Computing Platform
  • 1