タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

azkabanに関するnubesのブックマーク (3)

  • Azkabanについて書く - wyukawa's diary

    ちまたではAirflow(https://github.com/airbnb/airflow)が話題のようですが、Azkaban(http://azkaban.github.io/)を使っている身としてはやはりAzkabanについて書かねばならないと思ったので書きます。別にAzkabanを使ってほしいという意味ではないです。むしろAirflowの運用エントリとか読みたいです。 AzkabanJavaで実装されたジョブ管理ツールです。開発が若干停滞気味ではありますが、細々と進んでいます。 特徴としては、下記の通りです。 インストールが簡単(バイナリは古いものしか無いのでソースビルドが必要だがgradlewなので簡単) ジョブの依存関係をグラフィカルに見る事ができる。 APIがある ジョブが失敗した時でもボタン一つで失敗したジョブだけ再実行できる TTLがあるけどジョブの実行ログをブラウザか

    Azkabanについて書く - wyukawa's diary
    nubes
    nubes 2015/10/28
    Azkaban meetup の流れか...。
  • バッチ処理、ジョブ管理について書いてみる - wyukawa's diary

    僕はHive, Pythonでバッチ処理を書いてAzkabanでジョブ管理するシステムを構築、運用した経験が2年ほどあるので今日はバッチ処理、ジョブ管理について書いてみようと思います。 僕の経験上Hadoop特有の部分、例えばテスト環境が作りづらいとかバッチサーバーはジョブをsubmitするだけなので負荷はそんなにかからないとか、はあるけれど割と汎用的なのではないかと思います。そもそもバッチ処理、ジョブ管理について書かれたものはほとんど見た事がないので参考になれば嬉しいし、こういう良い方法もあるよ!とかあれば是非ブログ等に書いてほしいと思っております。 最初に言っておくとバッチ処理、ジョブ管理において重要なのは障害時のリカバリのしやすさです。正常時はまあいいでしょ。 なので例えば引数に日付を持てないようなバッチ書いたら辛いですし、LL言語で書く方がコンパイル、パッケージングとか楽です。CP

    バッチ処理、ジョブ管理について書いてみる - wyukawa's diary
    nubes
    nubes 2015/06/17
    良記事すぎる。
  • Building a Self-Service Hadoop Platform at Linkedin with Azkaban

    LinkedIn developed the Azkaban workflow manager to schedule and run Hadoop jobs. They created versions 1.0, 2.0, and 2.5 of Azkaban, adding new features like plug-ins, authentication, and a redesigned UI. Azkaban is now used by over 1,000 LinkedIn users to run 2,500 workflows and 30,000 jobs daily across multiple Hadoop clusters.Read less

    Building a Self-Service Hadoop Platform at Linkedin with Azkaban
  • 1