You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
奈良で迎える初めての冬が想像以上に寒くて、原付での移動に辛さを感じ始めました.学生の方の松浦です. 最近はStormというストリーム処理エンジンを触っています.HadoopやS4などの既存CEPエンジンがフォーカスしていなかった領域をカバーするものとして注目されているものです. StormはGithub上でプロジェクトが公開されており、ライセンスの範囲であれば誰でも利用することが可能です. 本記事ではStormを始めてみるにあたっての手順を簡単にご紹介したいと思います. そもそもStormって? StormはTwitter社のNathan Marz氏が開発したJVM上の分散処理フレームワークです.Stormの大きな特徴として 高速なストリームデータ処理 耐障害性 の2点がよく挙げられます(このような機能を実現している手法については、長くなるので参考URLの2件目などを参照していただければと
まず、両者はかなり性質の異なるプロダクトなので、以下の比較は筋違い。 筋違いであることを前提に、ストリームデータ処理プラットフォームとしての両者を比べてみる。 基本情報 fluentd http://fluentd.org/ 今をときめくログコレクター/イベントアグリゲーター。Rubyで実装されているが軽量高速。 RPC基盤ではなく、その下のレイヤーに位置するプロダクト。 Storm http://storm-project.net/ 分散RPC基盤。ストリームデータ版MapReduce風フレームワーク。Java+Clojureで実装されている。 概要については、下記のスライドがとてもわかりやすかった。 Twitterのリアルタイム分散処理システム「Storm」入門 ストリームデータ処理で何をするのかについて ストリームデータ処理のニーズについて、自分が理解している範囲での簡単な説明。 典
こんばんは、kimukimuです。 今日はいつものAndroidではなくて、Hadoopで最近調べていることを書きます! 1. 最近Hadoopは熱いんです! 最近、Hadoopを用いたビジネスがひたすら熱いです。 『Big Data』を扱う新たな情報分析プラットフォームとして、 破壊的なまでの広がりを見せています。 これまで1日かかっていたデータの集計が、 15分で出来るようになり、より素早い意思決定が可能になる。。。。 それを特別なハードは使わず、マシンを束ねてやってのけるというのはすごいですよね。 2〜3年前にAmazon Elastic MapReduceが登場したころに弄ってみて、 価値が理解できずに投げ出した過去の自分を蹴り飛ばしたいくらいに。 しかも、ついこの間次世代MapReduce(Hadoop-0.23)も発表されて、さらに勢いが増しています。 ただ、これはどうやら現在
こんにちは。kimukimuです。 今日もStormの話です。 ですが、今日は少し趣向を変えてStormが実際にどんな場所で使われているかを紹介してみます。 ・・・というのも、Stormって「リアルタイム分散処理フレームワーク」ではありますが、 それだけだと何ができるかさっぱりで、かつ日本では実運用として使っている場所は無いので。 #あるかもしれませんが、少なくとも情報は公開されていません。 そんなわけもあって、紹介するのは全て外国の企業となりますが、書きますね。 尚、元情報はStormのWikiからです。 企業名 用途 Groupon リアルタイムのデータ統合に使用している。重複しないデータをまとめるのに有用。 Rubicon Project リアルタイム入札システムにおける広告の表示回数の解析に使用。毎日6億5千万のオークションの結果を毎日処理し、より有効な広告の提案を行っている。また
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く