このガイドラインについて こちらのガイドラインは社内のバッチ処理スクリプト開発にあたっての、安定運用等に関わるガイドラインを公開用に書きなおしたものになります。 バッチサーバ規則 基礎項目 以下の要項を満たすことを確認する その他の用途で動作しているサーバ上での動作は行っていないこと 運用期間中に想定しうるデータ量にてOOMキラーに殺されないこと 想定の時間で終了すること データの読み込みは極力Read Replicaを見ていること データの書き込みによる本番サーバへの影響が見積もれていること 冪等性が担保されており、何度実行しても処理上の不具合は発生しないこと 多重実行時に不整合が発生しないこと エラー時の社内への通知が用意されていること エラー時の通知には再処理のための手順が揃っていること、もしくはそのドキュメントの場所が示されていること 個人ユーザー下にログや成果物を絶対に書き込んで
---- ---- ---- 追記: 2015/10/12 今では Datadog の公式エージェント (dd-agent) に組み込まれているので、How to monitor Fluentd with Datadog を読むことをオススメします。 ---- ---- ---- Fluentd のバッファ監視といえば、弊社の @moaikids さんが書いた munin-fluentd をはじめとして、いくつか既存のソリューションがありますが、弊社のメトリクス監視を Datadog に移行するタイミングで、munin-fluentd と同じ監視が Datadog にも欲しいよねということになって書いたので、それを紹介したいと思います。 Datadog Fluentd Integration 一言で説明すると、munin-fluentd と同じように、output プラグイン毎の retr
ボクには黒歴史がある。 WEBエンジニアとして働き始めた頃の話だ。 当時は、社内のお荷物的なキャラだった。 外注で客先に行ってはクレームが入り、社内に出戻りするような日々を送っていた。 社内の居心地も悪く、何とか這い上がろうと必死に勉強していた時期でもある。 ただなかなか勉強した成果が出ない。 そんなとき「自宅サーバを立ててWEBサイトを公開すると実践的な勉強ができる」と聞いた。 早速試してみた。 しかしこの安易な考えが、ボクの黒歴史を作ることになってしまう・・。 ノートPCが起こした大惨事 朝、会社への通勤途中にアパートの大家さんから電話がかかってきた。 大家「キミの部屋燃えてるから!」 自分「え!?」 大家「キミの部屋が燃えてるから早く帰ってきて!」 自分「え!?」 大家「いいから早く戻ってこい!」 自分「え!?あっは、はい!」 ボクは、上司に事情を話し会社に行けないことを伝えると、す
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く