タグ

embulkに関するma7eのブックマーク (3)

  • ERRORログが多すぎるWebアプリに出会ったら - GMOインターネットグループ グループ研究開発本部

    次世代システム研究室のDevOpsネタ担当(最近は運用寄り)のM. Y.です。 最近仕事で、あるWebアプリのログファイルを解析する機会がありました。そのログファイルはERRORレベルのエラーログが非常に多く、それらのERRORログから実際に注意しなければならないログを発見する、というのがそのときの目的でした。 アプリを作り始めたときはログ形式に注意を払っていたのに、そのアプリが歴史を重ねるうちにルールが曖昧になったり、開発者が変わってルールが失伝しまうというのは良くあることだと思います。逆に、大したことないアプリだと思って適当なログ形式にして作ったら、思った以上に長年使われて後悔するというパターンもありますよね。私も、そういう経験が何度かあります。 そこで今回は、ありがちな事例を描画して、そういうWebアプリに出会ってしまったときの対処方法について考えてみます。また、後半ではログ解析の分

    ERRORログが多すぎるWebアプリに出会ったら - GMOインターネットグループ グループ研究開発本部
  • Embulkを使って大量の謎ログを読み込ませる手順 - Qiita

    2015.3.16: @hiroysatoさんから教えていただいたnewコマンドをベースにした方法へ大幅に書き換え。 背景 セキュリティ関係のなんとかみたいな仕事をしていると、ある時急に数TBの謎のログを手渡されて「これ明日までになんか解析してみて」みたいなムチャぶりが飛んでくることがあります。このようなデータ分析では分析手法云々という前に、正規化してDBに取り込んだりする作業に相当の労力が必要になります。こういう事案に対していまどきなデータ転送ソフトウエアであるembulkを使うとだいぶ分析にとりかかれるまでの作業が楽になるのではないかと思ったので、一連の手順をまとめてみました。 前提条件 大きいサイズ(数GB〜数TB)のログデータを取り込みたい ログデータは1行1レコード形式のテキストで複数ファイルに分割されている ログの出力形式などは謎。既存のプラグインなど存在しない 出力形式の推定

    Embulkを使って大量の謎ログを読み込ませる手順 - Qiita
    ma7e
    ma7e 2015/03/15
  • 20150219 初めての「embulk」

    2. 自己紹介  舛岡英人( Masuoka Hideto ) - Twitter アカウント  hidetomasuoka  2012 年 - PFI に Join - 製品事業部  趣味 - フットサル - 旅行 2

    20150219 初めての「embulk」
  • 1