タグ

ブックマーク / qiita.com/kimutansk (3)

  • SparkInternalsで知る、Sparkの内部構造概要(Architecture) - Qiita

    はじめに こんにちは。 前回に引き続き、SparkInternalsを訳していきます。 前回と同じく以後は下記の判例となります。 SparkInternals訳文 コメント 既に3章でSparkジョブについて記述しているが、章では全体のアーキテクチャと、Master、Worker、Driver、Executorといった要素が如何に協調してジョブを終了させるかについて記述する。 図を用いて理解したい場合はコードの部分は読み飛ばしてもらって構わない。 Deployment diagram 概要章にて、下記の図を用いて概要説明を行った。 次はこの図の詳細についてみていく。 Job submission この図はどのようにMasterノード上に存在するDriverプログラムがジョブを生成し、Workerノードに登録するかを示している。 Driver側の振る舞いは下記のコードの流れとなっている。

    SparkInternalsで知る、Sparkの内部構造概要(Architecture) - Qiita
    nminoru
    nminoru 2017/03/21
  • ストリーム処理とは何か?+2016年の出来事 - Qiita

    この記事で書いている内容は? ストリーム処理とはそもそも何かからはじまり、必要になる検討ポイントなどの情報を振り返り用にまとめたものです。 あとは、今年個人的にこの分野に影響が大きかったと思ったイベントをまとめています。 他の方へ説明する際のベースとするためにまとめているため、 既にこの分野を知っている方にとっては冗長な内容も多いかもしれませんが、 その場合は適宜読み飛ばしていただけると。 あと、私の他記事からも内容引っ張ってきているのでかぶりはあると思います。 特にGoogleが考えるストリームデータ処理とは?とは目的もかぶっているので相応に被りがあるかと・・・ 出来るだけよく出てくる固有の言葉を最初から使用せずに書いているつもりですが、 何かわかりにくい場所あればコメントいただけるとありがたいです。 「ストリーム処理」とだけ書くと微妙にストリーミング配信等とも混同しやすいですが、 デー

    ストリーム処理とは何か?+2016年の出来事 - Qiita
  • Apache NiFiでデータフローをGUIから定義 - Qiita

    はじめに 皆さん、こんにちは。 この記事はドワンゴ Advent Calendar 2015の13日目の記事です。 注目される可能性も高い機会ですので、Apache NiFiを紹介させていただきます。 日だと扱っている方が(おそらく)少ない関係上、日語情報も乏しく、ほぼ全て英語情報というのは寂しい状況ですので。 ですので、もし見て興味がある方が増えればいいなぁと。そんなわけで、お付き合いください。 Apache NiFiとは? Apache NiFiとは、一言で言うとGUIからフローが定義可能なデータフロー構築ツールです。 下記のようなデータフロー1をGUIから定義し、稼働させることが出来ます。 ローカルファイルをHDFSに投入 HTTPリクエストを待ちうけ、結果をファイルに出力 Syslogを待ちうけ、結果をデータベースに投入 Twitterからツイートを取得し、Kafkaのようなメ

    Apache NiFiでデータフローをGUIから定義 - Qiita
    nminoru
    nminoru 2016/07/19
  • 1