qiita.com[B!]新着記事・評価 - はてなブックマーク

[Embulk] DBの接続情報とクエリを環境変数とLiquidを使って上手に分割する方法 - Qiita

6 users

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

テクノロジー
2016/07/07 11:46

あとで読む

Digdag serverでH2やPostgreSQLのデータベースにデータを格納する - Qiita

4 users

qiita.com/hiroysato

はじめに Digdagのサーバは、H2(Java組み込みデータベース)やPostgreSQL内にプロジェクトなどの情報を格納することができる。 Digdagのサーバの設定は次の三つの場所に格納できる(ようだ) H2オンメモリ H2パス指定 (組み込みJavaのデータベースでパスを指定して永続化) PostgreSQL 設定ファイルの形式サーバの設定はJavaのシステムプロパティ形式で記述する(参考)。key = valueという形式です。将来的にはHOCON形式で記述できるようになるかもしれないとのこと。use HOCON configuration format :で区切った形式でも大丈夫なようですが(参考)、各種サイトを見ると=で書いているほうが多いので、=で統一することにしました。 H2オンメモリの場合 digdag scheduler -mとすれば良いようだ。(参考) オンメモ

テクノロジー
2016/06/20 20:42

Digdag schedulerで定期実行するプロジェクトを作ってみた。 - Qiita

3 users

qiita.com/hiroysato

はじめに Digdagで定期実行するプロジェクトを作ってみました。 (表記ゆれというか用語間違いがあるかもしれませんのでお気づきの際はご指摘ください) 疑問誰か教えてください。セッションとアテンプトの違い？ 1回のセッションで実行されたそれぞれのタスクの実行結果は確認できるのか？現在はスケジューラを停止すると結果が消えてしまうが、結果を永続化するにはどうすれば良いか？(PostgreSQLを使う？H2でも永続化可能) スケジューラはスケジューラだけさせて別プロセス(別ホスト)でタスクを実行するには？プロジェクトの作成 foo.digを作成します。1分毎に現在時刻を表示します。その後"Hello"と出力します。 digdag scheduler 2016-06-18 11:09:36 +0900: Digdag v0.8.2 2016-06-18 11:09:38 +0900 [IN

テクノロジー
2016/06/20 12:47

Embulk 0.8.3で導入された-cオプションはLiquidを使った設定ファイルとの連携に便利 - Qiita

6 users

qiita.com/hiroysato

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

テクノロジー
2016/06/17 00:34

ワークフローエンジンDigdagのまとめ - Qiita

93 users

qiita.com/hiroysato

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 2016/06/15に、トレジャーデータがオープンソースとして公開したワークフローエンジンDigdagのリンク集です。内容は随時更新します。またトレジャーデータではDigdagを自社でTreasure Workflowとして提供しています。こちらの情報も収集しています。変更内容が気になる方は変更履歴をご覧ください。 1. 開催されるイベント 2. オフィシャルページオフィシャルページソースリポジトリ 3. チュートリアル Getting started (英語) Treasure Data社のOSSワークフローエンジン『Digda

テクノロジー
2016/06/15 15:27

Embulkのソースコードスタイルチェック方法 (Java編) - Qiita

19 users

qiita.com/hiroysato

1 概要 EmbulkのJava関連のコードは、Prestoと同じコードスタイル(Airlift codestyle)で記述されていますした。 (Embulk本体は、v0.9からGoogle Java Styleの一部修正版が採用されています。(2018/2/8追記)) 下記の手順で、プラグインのソースコードが同じコードスタイルになっているかどうかをチェックすることができます。 Gradleの設定とIntelliJ IDEA 15 CE(OSX)、の設定それぞれについて解説します。ちなみに、Gradleの設定は、embulk newしたときに自動的に生成できるようにするPRを作成しました。 [Propose] Add checkstyle settings in Java plugin generator いい悪いどちらでも是非、コメントください。プラグイン内のコードスタイルをチェッ

テクノロジー
2016/01/09 12:16

並列化で3倍以上速くなるembulk v0.8 - Qiita

4 users

qiita.com/hiroysato

processor : 0 vendor_id : GenuineIntel cpu family : 6 model : 62 model name : Intel(R) Xeon(R) CPU E5-2620 v2 @ 2.10GHz stepping : 4 microcode : 0x428 cpu MHz : 2100.000 cache size : 15360 KB physical id : 0 siblings : 12 core id : 0 cpu cores : 6 apicid : 0 initial apicid : 0 fpu : yes fpu_exception : yes cpuid level : 13 wp : yes flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca c

テクノロジー
2015/12/25 18:40

Embulk JSON関連のfilterプラグインを触ってみた。 - Qiita

6 users

qiita.com/hiroysato

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

テクノロジー
2015/12/20 00:37

embulk-output-elasticsearchとelasticsearchの注意点 - Qiita

3 users

qiita.com/hiroysato

1.Xと2.xで互換性が無いのは、2.0になってJavaのAPIが大きく変わり、下位互換性が失われたためです。 2016/03/08 追加 embulk-output-elasticsearchはAWS ESには未対応です。 @nora96o @matetsu さんの先のツイートで書かれてる通りで、embulk-output-elasticsearchはTransport Client使ってるんですが、AWS ESで使えないので繋がらないです。。 https://t.co/5jKHbNzCdj — oreradio (@oreradio) 2016年3月8日以下は古いまとめです。まとめ embulk-output-elasticsearch 0.1.8はElasticsearch 2.X系に接続できません。 elasticsearchは1.Xを使いましょうもし諸般の事情でelasti

テクノロジー
2015/12/11 11:32

全文検索エンジンGroongaを使ったEmbulk導入事例 - Qiita

4 users

qiita.com/hiroysato

この記事はembulk advent calendarの6日目の記事です。 Qiitaでembulkのまとめを作っている佐藤(@hiroysato)です。毎年11月29日のいいにくの日にに開催される全文検索エンジンGroongaの勉強会にて、全文検索エンジンGroongaにデータを投入するembulk-output-groongaの紹介をしてきました。 Groonga導入事例 Groongaについて Groongaは国産の全文検索エンジンです。全文検索機能を単体で使うだけではなく、MySQL(Mroonga)やPostgreSQL(PGroonga)に全文検索の機能を提供することができます。さらにPGroongaはJSONで格納したデータ内のすべてのテキスト値に関しても全文検索機能をサポートしています。国産の全文検索エンジンだけあって、日本語特有の全角文字と半角文字の正規化などの機能も

テクノロジー
2015/12/06 12:33

embulk-filter-join_fileを使ってみた。 - Qiita

3 users

qiita.com/hiroysato

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

テクノロジー
2015/11/12 19:10

embulk
join

巨大なバッチを分割して構成する〜SQLバッチフレームワークBricolage〜を使ってみた - Qiita

8 users

qiita.com/hiroysato

テーブルの名前をちょっとだけ変えてcreate tableしたりデータをinsert intoすることがしたくなり、なにか良いツールはあるかな？と探していたところ、Cookpadの青木さんが「たべみる」で使われているbricolageを見つけました。不思議と使ったという情報がみつからず、使用した記録をまとめました。 bricolageの利用例など是非教えてください。参照サイト巨大なバッチを分割して構成する〜SQLバッチフレームワークBricolage〜 GitHub Wiki 試した環境 OS: OSX 10.11.1 Ruby: 2.2.3 PostgreSQL: 9.4.5 MariaDB: 10.0.21 導入 PostgreSQLとMySQL(mariadb)等が必要になるようなので事前に導入しておきます。本体はgem install bricolageで導入できます。

テクノロジー
2015/11/11 23:02

Embulkのコマンドヘルプまとめ - Qiita

7 users

qiita.com/hiroysato

Embulk v0.8.3 Usage: embulk [-vm-options] <command> [--options] Commands: mkbundle <directory> # create a new plugin bundle environment. bundle [directory] # update a plugin bundle environment. run <config.yml> # run a bulk load transaction. cleanup <config.yml> # cleanup resume state. preview <config.yml> # dry-run the bulk load without output and show preview. guess <partial-config.yml> -o <outp

テクノロジー
2015/11/10 13:44

embulk

Embulkの設定ファイルをincludeで共有化する方法 - Qiita

20 users

qiita.com/hiroysato

まとめ Embulkの設定ファイルの中で同じ設定をしている部分を別ファイルにすることができます。別のファイルにする設定ファイルは、_テンプレート名.yml.liquidという名前にします。別の設定ファイルは、設定ファイルと同じディレクトリが起点ディレクトリになります。読み込む設定ファイルは、サブディレクトリを作ることはできますが、親ディレクトリを..を使って参照することはできません。(セキュリティに関する配慮) 読み込み時に変数を設定することもできます。 include先のファイル名にハイフンは使えません。(理由は調査中) 動機 Embulkを利用する頻度が増えてくる場合、次のような問題が生じます。同じ設定内容を、複数のYAMLファイルに記述しなければいけない。設定ファイルが肥大化して管理するのが大変だこの問題は、Embulkに搭載されているテンプレートエンジンLiquidの機

テクノロジー
2015/10/29 11:11

過去のログをEmbulk(エンバルク)を使ってバルクロードしよう - Qiita

5 users

qiita.com/hiroysato

はじめにここ一ヶ月ほど触ってみてたEmbulkの利用方法の一例を示します。もっと良い方法があるかもしれません。(是非教えてください) 古橋さんをはじめとしたトレジャーデータの皆様便利なツールを作っていただきありがとうございます。 Twitterで様々な質問に答えてくださった古橋さんに感謝いたします。 2016年6月29日追記: 参照してくださっている方が多いので最新のembulkの表記に修正しました。間違いがありましたらお気軽にお問い合わせください。動機いろいろなログが、メールやらファイルやらで蓄積されている。 RDBやElastic Search/Kibanaに簡単に突っ込んで可視化をしたい。 Embulk良さそう。ログをCSVやTSVにするスクリプトは自前・ネットのものがある。想定読者圧縮された過去のログファイルが沢山ある(今回はPostfixのログ) ログを整形して加工

テクノロジー
2015/10/09 19:10

Embulk

巷で知ったEmbulkプラグイン開発ノウハウ(Java編) - Qiita

6 users

qiita.com/hiroysato

List<String> columnNames = task.getColumns(); ImmutableList.Builder<Column> builder = ImmutableList.builder(); int i = 0; for (String columnName : columnNames) { for (Column inputColumn: inputSchema.getColumns()) { if (inputColumn.getName().equals(columnName)) { Column outputColumn = new Column(i++, columnName, inputColumn.getType()); builder.add(outputColumn); break; } } } Schema outputSchema = n

テクノロジー
2015/10/09 19:00

Embulk

Embulk(エンバルク)プラグインのまとめ - Qiita

34 users

qiita.com/hiroysato

Embulkプラグインのまとめページです。以前Fluentdのバッチ版Embulk(エンバルク)のまとめに掲載していたプラグインに関する記事を別ページにしました。プラグインの一覧は、公式なものがList of Plugins by Category にあります。こちらのページは、GitHubのスターの多い順ダウンロード数が多い順に並ぶようになっています。本ページは各プラグインをできるだけ用途別に分類したり、作者の方が作成したプラグインの解説ページなどのURLを追記しています。組み込みプラグインの説明 embulk本体を入れると利用できるプラグインの解説です。 Embulk組み込みプラグインの設定覚え書き様々なプラグイン(0.4.0)以降 Embulk 0.4.0リリースで、プラグイン構造が代わり新しいgemは、Embulk-{Input|Output|Filter|Parse

テクノロジー
2015/09/15 16:39

EmbulkとJava7 - Qiita

3 users

qiita.com/hiroysato

% embulk run test.yml 2015-07-24 17:51:36.258 +0900: Embulk v0.6.19 LoadError: load error: embulk/parser/apache-log -- java.lang.UnsupportedClassVersionError: org/embulk/parser/ApacheLogParserPlugin : Unsupported major.minor version 52.0 require at org/jruby/RubyKernel.java:1071 require at /path/to/embulk/bin/embulk!/META-INF/jruby.home/lib/ruby/shared/rubygems/core_ext/kernel_require.rb:135 requi

テクノロジー
2015/07/24 18:28

Embulk(エンバルク)組み込みプラグインの設定覚え書き - Qiita

14 users

qiita.com/hiroysato

Embulk組み込みプラグインの設定覚え書きその他の情報はFluentdのバッチ版Embulkのまとめをご覧ください。 Embulkには組み込みでいくつかのプラグインが用意されています。この資料ではEmbukの基本的な概念を説明したのち、組み込みのプラグインについて解説をおこないます。詳細は、オフィシャルのマニュアルを参照してください。Configuration (英語) 1, レコード、カラム、そして型 Embulkは、内部でデータをレコードとして取り扱いします。レコードは、複数のカラムから構成されるデータ1件のことを表します。例えば住所録では、人1名の情報がレコードです。1名の情報には、氏名や年齢といったその人固有の情報があります。この固有の情報一つ一つがカラムです。それぞれのカラムには型があります。姓や名であれば文字列、年齢であれば数字(整数)、生年月日であれば日付(日

テクノロジー
2015/03/14 20:48

Fluentdのバッチ版Embulk(エンバルク)のまとめ - Qiita

101 users

qiita.com/hiroysato

Embulk(エンバルク) (2016/10/05からロゴが変わりました。変更理由) Embulkのまとめ2ndを作ってます。 Embulk v0.11 でなにが変わるのか: ユーザーの皆様へをご一読ください。更新時にコメントを書くようにしました。変更内容に興味のある方は編集履歴をご覧ください。 2018年1月30日リリースのembulk 0.9からgemは提供されなくなりました。gem版は0.8.39までとなっています種類バージョンロゴの下のバージョンは開発版の最新バージョンを表しています。一般の方は0.9系を利用しましょう 2015年1月27日、Fluentdのメインコミッターの一人古橋さんが中心となって開発した、fluentdのバッチ版のようなツールEmbulk(エンバルク)がリリースされました。この記事は、Embulkってなに？、どんなプラグインがあるの？、どうやって独

テクノロジー
2015/02/19 01:14

はてなブックマーク

はてなブックマーク

『qiita.com』

DigdagとEmbulkの連携で便利なdigdagの変数参照 - Qiita

[Embulk] DBの接続情報とクエリを環境変数とLiquidを使って上手に分割する方法 - Qiita

Digdag serverでH2やPostgreSQLのデータベースにデータを格納する - Qiita

Digdag schedulerで定期実行するプロジェクトを作ってみた。 - Qiita

Embulk 0.8.3で導入された-cオプションはLiquidを使った設定ファイルとの連携に便利 - Qiita

ワークフローエンジンDigdagのまとめ - Qiita

Embulkのソースコードスタイルチェック方法 (Java編) - Qiita

並列化で3倍以上速くなるembulk v0.8 - Qiita

Embulk JSON関連のfilterプラグインを触ってみた。 - Qiita

embulk-output-elasticsearchとelasticsearchの注意点 - Qiita

全文検索エンジンGroongaを使ったEmbulk導入事例 - Qiita

embulk-filter-join_fileを使ってみた。 - Qiita

巨大なバッチを分割して構成する〜SQLバッチフレームワークBricolage〜を使ってみた - Qiita

Embulkのコマンドヘルプまとめ - Qiita

Embulkの設定ファイルをincludeで共有化する方法 - Qiita

過去のログをEmbulk(エンバルク)を使ってバルクロードしよう - Qiita

巷で知ったEmbulkプラグイン開発ノウハウ(Java編) - Qiita

Embulk(エンバルク)プラグインのまとめ - Qiita

EmbulkとJava7 - Qiita

Embulk(エンバルク)組み込みプラグインの設定覚え書き - Qiita

Fluentdのバッチ版Embulk(エンバルク)のまとめ - Qiita

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

『qiita.com』

このページはまだブックマークされていません

キーボードショートカット一覧

公式Twitter

はてなのサービス

このページはまだ
ブックマークされていません