[B! workflow-engine][workflow-management-system][digdag] nabinnoのブックマーク

nabinno id:nabinno

workflow-engineとworkflow-management-systemとdigdagに関するnabinnoのブックマーク (61)

digdag の rb オペレータで bundle exec を使う３つの方法 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
nabinno 2019/03/03
digdag

workflow-engine

workflow-management-system
リンク
Digdagのスケジュール設定
Digdagではcronのように定期的にジョブを実行したり、指定した時間内に処理が終わらなければい警告を出すことができます。 🍮 schedule：指定した時間にジョブ実行timezone: Asia/Tokyo schedule: minutes_interval>: 1 +current_date: sh>: echo `date` +echo_hello: sh>: echo hello
nabinno 2019/01/26
digdag

workflow-engine

workflow-management-system
リンク
digdag secrets を楽して環境変数にマップしたい - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
nabinno 2019/01/23
digdag

workflow-engine

workflow-management-system
リンク
digdag タスクの docker 実行について - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
nabinno 2019/01/20
digdag

workflow-engine

workflow-management-system
リンク
GitHub - szyn/mog: mog is the CLI for Digdag (Unofficial) (https://www.digdag.io).
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
nabinno 2019/01/01
digdag

workflow-engine

workflow-management-system
リンク
メルカリのデータ分析基盤の紹介〜BigQuery周辺の話〜 | メルカリエンジニアリング
Mercari Advent Calendar 2017 の9日目はメルカリ SRE(Site Reliability Engineering) チームの @syu_cream がお送りします。メルカリでは様々なデータを BigQuery に格納して、データ利用を可能にしています。 BigQuery に格納しているデータの具体例としては、 Web サーバや API サーバのアクセスログやアプリケーションのログ、以前当ブログで紹介した Pascal のイベントログなどが挙げられます。メルカリのデータ分析基盤に関する情報はこれまでに以下のようなブログやスライドで紹介しております。 Pascal〜Puree + ngx_lua + Fluentd + BigQueryでつくるメルカリのログ分析基盤〜 fluent-agent-hydraで省エネログ転送メルカリのデータ分析基盤 / me
nabinno 2019/01/01
digdag

workflow-engine

workflow-management-system
リンク
TB越えのMySQL 巨大テーブルを 1日で BigQueryへLOADする | メルカリエンジニアリング
こんにちは!! 私はメルカリでSREをしている k-oguma ( ktykogm ) です。ちょうど1年くらい前にジョインしました。よろしくお願いします! 今日は、タイトルの件で対応した方法をご紹介したいと思います。それはある日突然やってきた TL;DR BigQueryへLOADさせる方法を考える初期の検討見直し Embulk Embulk 説明 Digdag Digdag 説明 Digdag呼び出し処理 Dry-run いざ、実行補足: もっと高速化させたいなら終わったあとは最後に参考にしたURL それはある日突然やってきたある日、ETL作業 (データ分析基盤運用)の依頼がUSチームからやってきました。要件は次のようなものでした。 1.4TB サイズの MySQL innodb tableを1つをBigQueryに上げる約1年分。期間指定。期限数日、なる早
nabinno 2019/01/01
digdag

workflow-engine

workflow-management-system
リンク
Digdag の Plugin をたくさん作ったので紹介するよ - Gunosy Tech Blog
こちらは Gunosy Advent Calendar 2018、7日目の記事です。なお、昨日の記事は @yutanim さんの RxSwiftにおける孫からの祖父母孝行でした。 qiita.com はじめにこんにちは、広告技術部のｷｳﾞｨﾀｽﾎﾟ(人工知能) (@Civitaspo) / Twitter です。 Gunosy に入社してから早いもので1年が経ちました。昨年の Gunosy Advent Calendar では僕は読む専門だったのですが、『Gunosyのパーソナライズを支える技術 -ワークフロー編-』を読んで非常に感銘を受けたのを覚えています。 tech.gunosy.io ここではそのとき感銘を受けた言葉を紹介しておきます。ワークフローは、いわばシステム上における兵站といってもいいでしょう。「戦争のプロは兵站を語り、戦争の素人は戦略を語る」という名言もあるくらいで
nabinno 2019/01/01
digdag

workflow-engine

workflow-management-system
リンク
数百GBのデータをMySQLからBigQueryへ同期する | メルカリエンジニアリング
SRE所属の @siroken3 です。最近はもっぱらパートナー会社様とのデータ連携環境構築を主に、時々プロダクションのMySQL環境と分析基盤との連携インフラの構築が多いです。本記事は、メルカリに出品された過去すべての商品をBigQueryへ同期するにあたって取り組んだ時のお話です。背景当社では分析目的などでBigQueryを以前から使用しており、プロダクションのMySQLからBigQueryへデータを同期して分析に活用してきました。特に商品を表すテーブルは重要です。しかし、後述する課題によりBigQueryにアップロードすることができなかったため、分析用のMySQL DBのスレーブとBigQueryを併用せざるを得ませんでした。とはいえ不便なので以前からBigQueryのみで商品テーブルも分析対象としたい要望がありました。課題メルカリでは販売済み商品を物理削除していないため、
nabinno 2019/01/01
digdag

workflow-engine

workflow-management-system
リンク
https://cmdevio-ssl-eb-proxy-weighted.classmethod.jp/treasuredata/slack-notification-on-digdag/
nabinno 2018/10/17
digdag

workflow-engine

workflow-management-system
リンク
https://cmdevio-ssl-eb-proxy-weighted.classmethod.jp/server-side/understanding-digdag-workflow-definition/
nabinno 2018/10/17
digdag

workflow-engine

workflow-management-system
リンク
Digdagを使ったジョブ管理 - MicroAd Developers Blog
はじめまして。アプリケーションエンジニアの中野です。以前、MicroAdのデータ基盤の記事で紹介されていましたが、マイクロアドではデータ基盤刷新のタイミングでワークフロー管理ツールのDigdagを採用しました。今回の記事では、Digdag採用の経緯やワークフローを作成する際に注意した点を紹介します。 Digdag採用の経緯マイクロアドのDSP*1であるBLADEではBidRequestやImpression*2、Click、Conversion*3、その他BLADEから出力される様々なログやマイクロアドの他のプロダクトのログ、他社から提供されるデータなど、様々なデータを広告配信最適化の分析に活かしています。これらのログを分析するバッチ処理は各々のジョブが複雑な依存関係を持っています。これまではcronやJenkinsを用いてこれらの処理を行っていましたがコード管理が出来ていない
nabinno 2018/10/04
digdag

workflow-engine

workflow-management-system
リンク
DigdagのPython APIを使う - Qiita
Digdagとはワークフローエンジンと呼ばれるもので、データ分析基盤を構築する際に、Shell ScriptでPythonバッチを順に流しているような場合に、実行順序をyamlで定義できます。 serverモードというものがあって、複数ホストによる分散コンピューティングもできるので、場合によってはCeleryを導入しなくても、すべてDigdagで済ますこともできるのではないかと思い、調査を始めました。ハマりポイント Language API - Python を使うに当たって、Python エンジニアが事前に知っておいた方がよいこと。１．digdagのPythonパッケージはどこで配布されているか次のサンプルを見てみましょう。 import digdag class MyWorkflow(object): def step1(self): digdag.env.store({'my_
nabinno 2018/09/12
digdag

workflow-engine

workflow-management-system
リンク
メルカリのデータ分析基盤の紹介〜BigQuery周辺の話〜 | メルカリエンジニアリング
Mercari Advent Calendar 2017 の9日目はメルカリ SRE(Site Reliability Engineering) チームの @syu_cream がお送りします。メルカリでは様々なデータを BigQuery に格納して、データ利用を可能にしています。 BigQuery に格納しているデータの具体例としては、 Web サーバや API サーバのアクセスログやアプリケーションのログ、以前当ブログで紹介した Pascal のイベントログなどが挙げられます。メルカリのデータ分析基盤に関する情報はこれまでに以下のようなブログやスライドで紹介しております。 Pascal〜Puree + ngx_lua + Fluentd + BigQueryでつくるメルカリのログ分析基盤〜 fluent-agent-hydraで省エネログ転送メルカリのデータ分析基盤 / me
nabinno 2018/08/27
digdag

workflow-engine

workflow-management-system
リンク
DigdagとEmbulkを利用してBigQueryにRDS（Aurora、MySQL）のマスタデータを同期する - Qiita
この記事はVASILY DEVELOPERS BLOGにも同じ内容で投稿しています。よろしければ他の記事もご覧ください。こんにちは、バックエンドエンジニアの塩崎です。さて、VASILYではData WarehouseとしてGoogle BigQuery（BigQuery）を利用しています。 BigQuery内にはプロダクトのマスタデータとユーザーの行動ログが格納されています。そして、それらに対する横断的なクエリを発行することでプロダクトの成長のためのKPIをモニタリングしています。そのためAmazon Relational Database Service（RDS）に保存されているマスタデータをBigQueryに同期する処理を定期的に実行する必要があります。先日、ワークフローエンジンであるDigdagとバルクデータローダーであるEmbulkを利用して、この処理を行うシステムを構築
nabinno 2018/06/17
embulk

bulk-data-loader

workflow-management-system

database

data-structure
リンク
digdagを使っててハマった事メモ - FLINTERS Engineer's Blog
S3にあるファイルを加工したり中間結果のファイルを保存したりTreasureDataに格納するような処理を書いていったときに発生したエラーメモ。 digdag version 0.9.24 github.com サーバーモードでdownload_fileオプションが使えないプロジェクトディレクトリ内にダウンロードしたはずのファイルが次のタスクで消え去ったファイルに保存せずにスクリプトを書いてDigdag.envを使ってクエリ結果を変数に保持させて対応別の方法も（参考 digdagのtd>のdownload_file）プロジェクト外のディレクトリを参照できない SQLファイル動的に生成してtdオペレータに渡すようなタスクを作った生成したファイルをプロジェクトディレクトリに保存するようにしたが次のタスクでNo such file or directoryになり参照できず（ローカルモー
nabinno 2018/05/25
digdag

workflow-engine

workflow-management-system
リンク
地球とSQL
とあるサービスのリリースのためにSQLを書いていたら、地球を感じられたお話です社内で行われたエンジニア懇親会の余興です
nabinno 2018/05/16
digdag

workflow-engine

workflow-management-system
リンク
digdagサーバをコンテナで動かしてジョブもコンテナで動かす際の設定例
はじめにこの記事はMicroAd Advent Calendar 2017の1日目の記事です。 Digdagはジョブをコンテナで実行する事ができ、スケールが容易なワークフローエンジンです。本エントリではそんなDigdagサーバ自体もコンテナで動かしながらジョブもコンテナで動かす際の設定やハマり所を紹介します。使用ソフトウェアとバージョン digdag: 0.9.21 docker: 1.12.6 全体像先にどんな感じの構成を実現しようとしているか、全体像を図示します。 _export: docker: image: python:3 +-------------+ | | | | +---+----+ +----v---+ | | | | docker run | digdag | | python | +---------> server | | (job) | | | | |
nabinno 2018/04/26
digdag

workflow-engine

workflow-management-system
リンク
Hivemall, Digdag, 自然言語処理, 機械学習などについて話しました #tdtech
2月19日に開催された PLAZMA: TD Tech Talk 2018 Internal Day で、Treasure Dataがユーザに提供している機械学習・自然言語処理の機能の実体をお話しました。録画もあがっているようです: PLAZMA TD Internal Day: TD Tech Talk 2018 - YouTube 「業務またはプライベートで機械学習に触れている方」という問いに対して聴衆の半数以上が手を挙げたのには正直驚きました。エンジニアリングとサイエンスの垣根が低くなっているというのは、大変喜ばしいことだと思います。そんな聴衆の皆様は、まさか2018年に、機械学習に関するトークでロジスティック回帰とTF-IDFの話だけ聞かされるとは思っていなかったことでしょう。わかりますよ。僕だってもっとゴツい手法をドーンと実装してバーンッって感じの結果を見せてドヤりたい。
nabinno 2018/02/26
digdag

workflow-engine

workflow-management-system
リンク
How to growth the delish kitchen team to data-driven team
DatabricksとSparkではじめる [ビッグデータETL処理/データ可視化] 実践入門 / Databricks and Spark with ETL and Visualization
nabinno 2018/02/20
digdag

workflow-engine

workflow-management-system
リンク
1 2 3 4 次のページ

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx