タグ

digdagに関するhohoho_ho2005のブックマーク (16)

  • 2019年のワークフローエンジンまとめ - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 概要 データパイプラインの管理にワークフローエンジンを導入したいのですが、今の要件に対してどれが合っているのか判断しきれない部分があるので整理してみました 最近の導入事例や発表をみるかぎりAirflow, Argo, Digdagあたりが人気なのかなと思います ワークフローエンジンとは ワークフローエンジンとは定期的なバッチ処理をうまく処理できるように、バッチ実行を管理してくれるソフトウェアのことです 古典的な実現方法としては適当なlinuxサーバーの上でcron実行させることが考えられますが、以下のような問題があります ジョブごとの依

    2019年のワークフローエンジンまとめ - Qiita
  • Digdagでワークフローを宣言的に書く! - Kekeの日記

    記事 私は、いくつか家内サービスを運用しています。 例えばCloud FunctionsとCloud SQLを使った「家計簿」を家族全員が使っていますし、自宅に「監視カメラ」をおいてLineBotで適宜確認できるようになっています。 無料枠を使い回しているのでデータ移行が定期的にありますが、そのときによくEmbulkを使っています。 非常に短い備忘録ですが、以下にまとめています。 www.1915keke.com この記事は短すぎて適当に見えるのですが、それくらいシステムは簡単だったことが印象でした。 今回はEmbulkと同じくTeasureDataで開発が進められているDigdagを使ってみて、どのような開発のしやすさなのかなど知識を増やしたいと思います。 Digdagについて 一体何をするもの? Digdagとは、トレジャーデータが公開したオープンソースなワークフローマネージャーです

  • Digdagを使ったジョブ管理 - MicroAd Developers Blog

    はじめまして。アプリケーションエンジニアの中野です。 以前、MicroAdのデータ基盤の記事で紹介されていましたが、マイクロアドではデータ基盤刷新のタイミングでワークフロー管理ツールのDigdagを採用しました。 今回の記事では、Digdag採用の経緯やワークフローを作成する際に注意した点を紹介します。 Digdag採用の経緯 マイクロアドのDSP*1であるBLADEではBidRequestやImpression*2、Click、Conversion*3、その他BLADEから出力される様々なログやマイクロアドの他のプロダクトのログ、他社から提供されるデータなど、様々なデータを広告配信最適化の分析に活かしています。 これらのログを分析するバッチ処理は各々のジョブが複雑な依存関係を持っています。 これまではcronやJenkinsを用いてこれらの処理を行っていましたが コード管理が出来ていない

    Digdagを使ったジョブ管理 - MicroAd Developers Blog
  • DigdagをHA構成にしてみた - ZOZO TECH BLOG

    こんにちは、最近のマイブームはマヌルネコ動画な新事業創造部バックエンドエンジニアの塩崎です。 今回のテックブログでは、以前にDigdagを紹介した記事の続編として、DigdagをHA構成にするためのTipsなどを紹介します。 Digdagとは Digdagはワークフローエンジンと呼ばれるソフトウェアです。 複数個のタスク間の依存関係からなるワークフローを定義し、そのワークフローの実行及び管理を行います。 この説明だけですと、何が便利なのかいまいちピンとこない方が多いかと思います。 ですが、かゆいところに手が届く便利ソフトウェアです。 具体的なかゆいところの紹介は以前にDigdagを紹介した記事の前半部分に書かれています。 Digdagを使用したことのない方はこちらを読んでから記事を読み進めると理解しやすいかと思います。 tech.starttoday-tech.com さて、前回の記事で

    DigdagをHA構成にしてみた - ZOZO TECH BLOG
  • 「Digdag」を使って依存関係のあるタスクをコードベースで管理する - タダケンのEnjoy Tech

    こんにちは! タダケン(@tadaken3)です。 会社で使っている分析基盤に、Digdagというワークフローエンジンを導入しました。digdagはとても魅力的なツールで、ぜひより多くの人にも使ってほしいなと思い、Digdagの導入方法をまとめてみました。 ところで、ボクはディグダといえば、ポケモンを思い出します。 Digdagとは Digdagをインストールする digファイルを作成してワークフローを記述する ワークフローを実行する まとめ 参考URL 読者登録をお願いします! Digdagとは Digdagは複雑なタスクを実行するためのTresure Dataが開発したOSSのワークフローエンジンです。 例えば、 外部APIからデータを取得する 取得したデータを成形する データをデータベースにインサートする みたいな処理を順番に実行したいとします。 cronで実行することもできますが、

    「Digdag」を使って依存関係のあるタスクをコードベースで管理する - タダケンのEnjoy Tech
  • Digdag 入門 - GMOインターネットグループ グループ研究開発本部

    D. M. です。レガシーの crontab が肥大化して困っています。今日はそのリプレイス候補である Digdag を使ってみた話です。 やりたいこと crontab は Linux のスケジューラの仕組みで定期バッチの実行用途でよく利用されますが低機能です。順序の依存関係やアラートは毎回独自に作りこまなければいけません。そのため近年は代替スケジューラを利用するケースが多いです。その候補のひとつである Digdag について検証したいと思いました。 Digdag を使うべき人 一般的にバッチスケジューラに求められる要件的には以下のようなものがあります。 ・スケジュール実行 ・複数バッチの順番の制御(ワークフロー) ・GUIでの管理 ・失敗時のアラート ・SLA 機能(長時間実行していたらアラートを飛ばす) ・分散実行 などなど 代替として広く知られているものですと Jenkins でのワ

    Digdag 入門 - GMOインターネットグループ グループ研究開発本部
  • Go言語製 Digdag Client (mog) をリリースしました #digdag | iroilog.net

    Go言語製 Digdag Client (mog) をリリースしました #digdagJune 25, 2017 こんばんは!久しぶりの更新となりましたが… またしてもDigdagネタです。 以前 Workflow Engines Night という名の勉強会で登壇させてただく機会があり、 社内におけるDigdagの導入事例を紹介させていただきました! その時の資料がこちら↓ こちらのセッションの中でスライドの48枚目~出ています mog というGo言語製のツールを事例紹介させていただいたのですが、 意外と好評だったこともありまして、Githubにてリリースをいたしました! mogのリポジトリはこちらです。 特徴Go言語製でJavaがなくても動かすことができるクライアントですただし、Digdagはサーバ / クライアント構成を前提としていますビルド済みのバイナリを配布しているので、Go

  • Digdagのアーキテクチャとコンセプトを理解する #digdag | DevelopersIO

    Treasure Data社によってOSSワークフローエンジン『Digdag』はその発表以後多くの反響を呼び、社内外を含め良く利用されるようになってきていますが個人的には下記の『試してみた』エントリ以降、あまり触って来ていませんでした。ちょっと個人的にも腰を据えて取り掛かってみようかという感じになってきましたので、仕組みや使い方を把握するという意味で一番参考になるであろう公式ドキュメントの一部を読み進めてみた記録をブログエントリとして残しておきたいと思います。 Treasure Data社のOSSワークフローエンジン『Digdag』を試してみた #digdag | Developers.IO Digdagのアーキテクチャ Digdagによるワークフローの自動化 ワークフローを使って、手動で行なっているあらゆる操作を自動化出来ます。一連のタスクを『ワークフロー』として定義し、Digdagを使

    Digdagのアーキテクチャとコンセプトを理解する #digdag | DevelopersIO
  • JenkinsからDigdagへ日次バッチを移行して幸せになるお話 // Speaker Deck

    DMM.comラボではビッグデータ基盤の日次バッチ(ETL処理)のワークフローエンジンとしてDigdagを採用しました。 ワークフローの運用は、障害時のリカバリ、進捗状況に応じた他システム連携、JOB実行時間の局所化など様々な課題があります。 Digdag選定理由や設計の勘所(サーバ構成・ワークフローの設計方針)、Digdag Plugin実装、他チーム連携のためのClient実装など、課題解決のために取り組んだ内容について紹介させていただきました!

    JenkinsからDigdagへ日次バッチを移行して幸せになるお話 // Speaker Deck
  • digdagをDockerizeしてECS上で運用することにしました - 雑なメモ

    データ分析や可視化に伴う複雑なジョブフローの改善にはdigdagが便利です。 少しずつ採用事例も増えているようです。 qiita.com 今回は、そんな便利なdigdagをECS上に構築しました。 *1 事前知識 digdagに関する基的な知識は、以前のエントリを参考にしてください。 yukiyan.hatenablog.jp コード サンプル用にコードを公開しました。 github.com digdagをDockerizeし、設定ファイル(digファイル)も一緒に固めてECRにpushしています。 つまり、digdagの最新の設定ファイルは常にECRにある状態です。 digdagの設定ファイルを変更したブランチがmasterにマージされると、shippableがdocker build・digdag check・docker push・ECSに関する処理をおこない、古いdigdagコン

    digdagをDockerizeしてECS上で運用することにしました - 雑なメモ
  • メモ DigdagによるRedshift + EMRの自動制御とデータ分析アプリケーションの開発 #tdtech - by shigemk2

    digdag github.com (途中参加) ワークフローエンジン Aをやって、Bをやって、でもBが失敗したらCをやる、というのを、コードを書かないで制御する サーバー どこの環境でも動くこと ワークフローが手元でも動く ステップを足す→ローカルで実行する サーバーでアプローチすればサーバーで動く Luigi 上から下へワークフローを動かす digdag digdag ネスト出来るようにした グループを作れる ある別のシステムがファイルをアップロードする→アップロードできたらコピーする パラメータは一部ビルトイン tdのクエリを実行する redshiftのクエリを実行する big query td for each ポスグレ メール などなど… slackへ通知も出来る ローカルで実行する→デプロイする サーバAで実行する→サーバBでも実行できるようにする 特定のプログラミング言語を特

    メモ DigdagによるRedshift + EMRの自動制御とデータ分析アプリケーションの開発 #tdtech - by shigemk2
  • Digdagのスケジューリングについて理解する #digdag | DevelopersIO

    Digdagを理解してみるシリーズ、3目は『スケジューリング』です。 Digdag | 特集カテゴリー | Developers.IO Digdagのアーキテクチャとコンセプトを理解する #digdag | Developers.IO Digdagのワークフロー定義について理解する #digdag | Developers.IO スケジュール設定 ワークフローを定期的に実行させるために、schedule: オプションをワークフローのTOPレベルに定義する事が出来ます。 timezone: UTC schedule: daily>: 07:00:00 +step1: sh>: tasks/shell_sample.sh schedule:ディレクティブでは、以下オプションの中から1つを選択可能です。 daily>: HH:MM:SS (daily>: 07:00:00) hourly>:

    Digdagのスケジューリングについて理解する #digdag | DevelopersIO
  • Jenkinsの無秩序なジョブをDigdagで再定義する - log.fstn

    jenkins で回してる ci のジョブを digdag で書き直してみたけど、フローがひと目で分かるし、git で管理できるし、並列化も簡単だし最高だ。— Kosuke Adachi (@foostan) October 8, 2016 ということで Jenkins のジョブを Digdag に置き換えて Git で管理すると最高なので、今困っている人はやりましょう。1日あれば多分終わります。 今回試したのは CI のジョブですが、どんなジョブでも応用できると思います。 詳しく こないだ Rebuild 152 聴いていたらその会話の中に「Jenkinsおじさん」ってワードが出てきたんですよ。 rebuild.fm Jenkinsをそれなりの規模で使っている人ならお馴染みだと思うんですが、Jenkinsって自由度が高くてジョブの編集も簡単にできるから気をつけないとジョブがカオスな状態に

    Jenkinsの無秩序なジョブをDigdagで再定義する - log.fstn
  • DigdagサーバへのTreasureData接続情報設定 - Qiita

    やりたいこと http://qiita.com/pilot/items/e763a67675e264ed0347 で作成したDigdagサーバに http://qiita.com/pilot/items/ff49174adbbfd0a3c9e4#digdag%E3%81%AEtd%E3%82%B5%E3%83%BC%E3%83%90%E3%83%A2%E3%83%BC%E3%83%89 でプロジェクトをpushしたがAPIキー・エンドポイントの設定ができず実行できなかった 当該プロジェクトにTreasureData接続情報(APIキー・エンドポイント)を設定して実行できるようにしたい 結論 digdag secretsで設定する APIキー設定 digdag secretsコマンドでサーバに設定する 以下のいずれかの方法で 方法1 - APIキー文字列をコマンドラインにべた書き $ dig

    DigdagサーバへのTreasureData接続情報設定 - Qiita
  • golang + Docker + BigQuery + digdag の例 - Qiita

    golang で BigQuery へ query をだし、その結果から グラフを png 画像として生成する例をつくりました。 それを cross compile し, digdag をつかって alpine の docker 中で実行させてみました。 生成されるグラフの例 注意: 現時点での golang のスクリプトは単に動作するだけのレベルで、golang としては改善の余地が大いにあります。 (2016-10-21)

    golang + Docker + BigQuery + digdag の例 - Qiita
  • ワークフローエンジンDigdagのまとめ - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 2016/06/15に、トレジャーデータがオープンソースとして公開したワークフローエンジンDigdagのリンク集です。内容は随時更新します。またトレジャーデータではDigdagを自社でTreasure Workflowとして提供しています。こちらの情報も収集しています。 変更内容が気になる方は変更履歴をご覧ください。 1. 開催されるイベント 2. オフィシャルページ オフィシャルページ ソースリポジトリ 3. チュートリアル Getting started (英語) Treasure Data社のOSSワークフローエンジン『Digda

    ワークフローエンジンDigdagのまとめ - Qiita
  • 1