タグ

ETLとpentahoに関するmonnalisasmileのブックマーク (1)

  • 初めてのPentaho Data Integration 4 良く使うStep

    良く使うStepたち。 具体的な使い方はSampleやCommunity Siteを参照して下さい。 使用頻度は扱うデータと目的に大きく依存しますので参考程度にして下さい。 入力 CSV input 1ファイルの読み込み。 Text file input 複数のファイルの読み込み ファイル名に例えば*.txtなどの正規表現も使える Generate Rows 空や定数の入力を作る Get File Names フォルダ内のファイル名を取得 その後、フィルターを通してファイルを読み込んだりする事が多い Data Grid Generate Rowsと異なり、Row毎に異なる値を設定出来る テストの時にダミーデータを作るのに便利 Table input データベースからの読み込み 出力 Table output データベースへの書き込み テーブルの入れ替えと追加だけ出来、変更は出来ない Upd

  • 1