ETLでのDWHへのデータ統合 テーブルの作成 事前準備として下の表の内容でデータベースsalesおよびデータベースpentaho_dwhにテーブルを作成しておく。今回は項目を最小限にしぼっている。また、pentaho_dwhはスタースキーマでの定義としている。
結論を先に。 細かい要件がない場合,zipcloud さんの提供している加工済データを使う (日本郵便さんの提供している原本ではなく) ライセンスが不明だけど Web API の利用規約とかみると商用利用等も OK と思われる わりきって Web API を使う (よそにまかせる) というのも手かも いろいろあるし。前述の zipcloud さん自身も検索 API を提供している。 以下各論。 いわゆる ken_all.csv を (必要フィールドだけ) そのままデータベースにつっこむなんてのは (わかってやってる場合はともかく) やってはいけない 複数行に分割されているレコードがあるため,マージする必要がある 明文化されていない仕様などがありマージやクリーニングを自力でおこなうのは大変 (バッドノウハウのかたまり) 参照: http://www.f3.dion.ne.jp/~elemen
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く