大規模データについて第4回～EMR開発_実装編～ - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/f81@github

2users がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

大規模データについて第4回～EMR開発_実装編～ - Qiita

実装のポイントについて不具合を想定する。リカバリやメンテ実行はコマンド一発全自動できるように... 実装のポイントについて不具合を想定する。リカバリやメンテ実行はコマンド一発全自動できるようにしておく。大規模データを取り扱うため、リカバリやメンテ実行の際にファイル移動や DBオペレーション等をしていると面倒だしミスの温床になるので、自動化しておきましょう。無駄にEMRが起動されないように。 EMRは１度起動してしまうと１時間分の課金が発生するので注意が必要です。 EMRで完結しない処理を前処理、後処理という形で切り分けておくと、前処理、後処理で失敗した場合にその部分だけやり直す運用ができるので効率的です。値チェックを入れる。 Hadoop処理では少々のエラーは突き抜けてしまいます。(ほとんど起きないですが) 集計の用途で別ロジックでの集計（hourly、daily）と比較できる値は処理完了時に整合性チェックしておくと安心です。設計はシンプルに、モジュールはコンパクト

ブックマークしたユーザー

equinox792014/03/04

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx