ここ何ヶ月か、なかなか外部に話しづらい仕事をしていたので技術ブログの更新が止まりましたが、また話しやすい領域の仕事に戻ってきたので細々とメモ的に書いていこうと思います。 リハビリ的に、非常に軽い話題で。 Fluentdの監視は概ねtcp(udp)のport監視と、適切な数プロセスがあるかのプロセス数監視を行なっています。 ただ、Fluentdのログに吐かれる内容に非常に神経質にならなければいけないケースも多いため(ex. "queue size exceeds limit"等)、ログの監視も最近始めました。 非常にナイーブに、1 linerでエラーを抽出するには、以下のように書いてあげると良いと思います。 cat ${LOG} | awk --assign d=${DATE} --assign h=${HOUR} --assign m=${MINUTE} '{split($2, t, ":