[B! log] yogasaのブックマーク

ログ分析勉強会 vol.1 - 資料一覧 - connpass

終了 2015/10/15（木） 19:00〜ログ分析勉強会 vol.1 セキュリティの陣 kenji kobayashi 他東京都千代田区平河町2-16-1 平河町森タワー2F

yogasa 2016/01/22

log

リンク

Fluentd vs. Logstash for OpenStack Log Management

Slide at OpenStack Summit Tokyo 2015. Session Info: http://sched.co/49tt Video: https://www.youtube.com/watch?v=1ye0-sityBwRead less

yogasa 2015/11/05

リンク

サービス改善はログデータ分析から

2014/09/09に行われた『サーバ/インフラエンジニア養成読本ログ収集〜可視化編』　出版記念！執筆者が語る大講演会！での発表資料です。 http://eventdots.jp/event/137658Read less

yogasa 2014/09/14

リンク

Login（アクセス）ログからわかる12の指標その１ - トレジャーデータ（Treasure Data）ブログ

*トレジャーデータはデータ収集、保存、分析のためのエンドツーエンドでサポートされたクラウドサービスです。「Login（アクセス）ログからわかる12の指標シリーズ」その１，その２，その３，その４クエリ内のTreasure UDFのリファレンスはこちら。本シリーズの主張は，例え単純な ”ログイン”（アクセス）の記録のみを取るだけでも，それにユーザーIDが付くことでトレジャーデータ上で遙かにリッチな示唆を得ることができる，ということです。もしユーザーを識別できるサービスをお持ちでこれから分析を始めたい企業様は，きちんとそれをloginログを残すことから始めましょう。本記事では「login（アクセス）ログ」というたった1種類のデータから得られる12の指標を紹介したいと思います。定義以下の項目で定義されるログを「loginログ」と定義し，かつ各ユーザーの登録時からこのログデータが取得

yogasa 2014/05/09

analytic
log

リンク

Splunk（スプランク）－マシンデータ分析プラットフォーム - セキュリティ事業 - マクニカ

様々なITシステムから生成されるデータの収集、検索、分析、可視化を行うデータ分析プラットフォーム全世界115か国以上、15,500社以上に導入されているSplunk マクニカは国内導入実績No1の一次販売代理店です 2009年よりSplunkの取扱いを開始して10年、導入社数600社。日本語ローカライズを支援した技術者を含む専任技術者やSplunk認定セールスが多数在籍しています。セキュリティやITインフラ管理、ビックデータ活用などの多様なシーンにおけるお客様の課題解決に向けて、ご提案から導入、構築、運用までをワンストップでサポートいたします。 Splunkで課題を解決する

yogasa 2014/04/09

Splunk
log

リンク

excale.net

This domain may be for sale!

yogasa 2014/02/26

リンク

Kibanaを使う理由

GoのGenericsを使った効率的なキャッシュの実装 / Effective Generic Cache in Golang

yogasa 2013/12/05

リンク

Fluentd 2013年開発・状況まとめ / 2014年に向けて | Post Moratorium

Fluentd 2013年開発・状況まとめ / 2014年に向けてワイワイ！Fluentd Advent Calendar 2日目担当の @kzk_mover です。このエントリでは2013年 Fluentd の開発・コミュニティの状況まとめをお届けします。 2013年開発まとめFluentdコア自体は2013年、191 commit (そのうち @repeatedly が 84 commit)。ドキュメントの方は326 commitあります。コア以外にも、2012年年末に約70だったプラグイン数は、2013年12月1日現在に約3倍の206個となっています。 Fluentdのコア自体は10回リリースされ、td-agentは6回リリースされています。大体Fluentdが月1回、td-agentが月に2回の計算になります。また、@repeatedlyがTD社に入社し、td-agentのメンテ

yogasa 2013/12/01

fluentd
log

リンク

大規模ログ分析におけるAmazon Web Servicesの活用

第27回TokyoWebmining 講演資料 http://tokyowebmining27.eventbrite.com/ バンダイナムコスタジオのログ集計・分析基盤”Greco”では、Amazon RDSとEMR、そして最近では様々なデータウェアハウスを検証した上でRedshiftを活用しています。OLTPとOLAP、双方のニーズに応えるためにどんなシステム構成を取っているか、また分析に耐えうる正確なログ出力のためにどんな工夫が必要か、の２点を重点的にお伝えします。 Read less

yogasa 2013/06/25

リンク

感情に訴えかけるログ、 Log::Minimal::Emotional ！！！！ - （ひ）メモ

某所で人間の脳には人の顔を識別するための特別な神経回路が最初から組み込まれていて、人の顔の違いを見分けたりというのが、他の図形よりも格段に高速に行えるようになっています。ということで、ログメッセージに顔文字を入れてみたら、なにこれすごいヽ(=´▽`=)ﾉってなったところ。という発言をみかけたので、つくりました。 Log::Minimal::Emotional - https://gist.github.com/hirose31/4958764 「エモーショナル」はお好みなものに容易に再定義可能です。 #!/usr/bin/env perl use strict; use warnings; use utf8; use Log::Minimal::Emotional; $Log::Minimal::Emotional::EMOTION->{CRITICAL} = '⊂二二二（　＾ω＾）

yogasa 2013/06/24

リンク

ログ解析ツール「Splunk」を使ってみた - カイワレの大冒険 Second

先日、qpstudyに参加してきた@masudaKです。@ar1さんと話しながら、荒木さんがLTでお話されたログの話をブログにあげたら、僕も書きます−と言ってしまったので、ちょいと書いてみます。荒木さんの記事・発表ではSumoLogic中心に書かれてましたので、Splunkを試してみました。 Splunkとはんで、Splunkとは何かということですが、製品概要をみてみると、以下のように書かれています。 1 2 3 4 5 6 7 8 パワフルな検索、分析、および視覚化機能。数千社に及ぶ導入実績。すぐに始められます。 Splunk Enterprise はマシンデータ用のプラットフォームです。すべての IT システムやテクノロジーインフラストラクチャから生成される膨大なマシンデータを収集、分析、および保護する簡単、スピーディかつ柔軟な方法を提供します。問題のトラブルシューティングや

yogasa 2013/04/16

Splunk
log

リンク

Fluentdで始めるリアルタイムでのログ有効活用

はじめに Fluentdは、ログを収集し格納するためのログ収集基盤ソフトウェアです。Fluentdにインプットされた、すべてのログをJSONに変換し、アウトプットします。インプットとアウトプットはモジュール化されており、モジュールを追加することでインプット元とアウトプット先を追加できるようになっています。 Fluentdは急速に知名度を高め、多くのWebサービス会社で実際に使用されるようになりました。従来のログが抱えていた問題も、Fluentdが適切な解決策となっていると認知され、かつ簡単に導入・スモールスタートできるミドルウェアであったことが大きかったと思います。本稿では、Fluentdの簡単な仕組みと導入方法、シンプルな動作事例について紹介します。対象読者システム管理者データサイエンティスト必要な環境 UNIX系OS Ruby 1.9 ログを出力する理由システム運用を始める

yogasa 2013/03/10

リンク

Labeled Tab Separated Values (LTSV) ノススメ - stanaka's blog

追記(2/8 11:30) id:naoyaによる一連のまとめが【今北産業】3分で分かるLTSV業界のまとめ【LTSV】 - naoyaのはてなダイアリーにあります。また、仕様などをまとめるために http://ltsv.org/ を立ち上げました。追記ここまで Labeled Tab Separated Values (LTSV) というのは、はてなで使っているログフォーマットのことで、広く使われているTSV(Tab Separated Value)フォーマットにラベルを付けて扱い易くしたものです。はてなでは、もう3年以上、このフォーマットでログを残していて、one-linerからfluentd、Apache Hiveまで幅広く便利に使えています。ログフォーマットに期待されることは、フォーマットが統一されている → 共通のツールで集計し易い新しいフィールドの追加が容易 → サー

yogasa 2013/02/09

リンク

【今北産業】3分で分かるLTSV業界のまとめ【LTSV】 - naoyaのはてなダイアリー

id:stanaka がはてなで使って居るログフォーマットが LTSV だよーとブログに書く Labeled Tab Separated Values (LTSV) ノススメ - stanaka's blog Web界隈のエンジニアたち、特にログとか、#fluentd 関係者がざわつく「ざわ・・・ざわ・・・」 @t_wada 「Unix 哲学の大事な点が形になっていると思う。素晴らしい。」 @hotchpotch 「cool」六本木、渋谷、白金台方面から京都へ熱い視線が送られる id:naoya がただ vagrant + chef を使いたいがために LTSV に乗っかる GrowthForecast を使っていたため GF の中の人が反応する @kazeburo 「[growthforecast]」 id:naoya が勢いで Text::LTSV を作るあまり反応がないのでしょ

yogasa 2013/02/09

リンク

LTSVフォーマットなログを fluentd + GrowthForecast で料理 - naoyaのはてなダイアリー

ここ数年のデータ解析の重要性の高まりから、ログに関するソリューションが方々で活発に探求されている昨今でございます。ウェブサーバーの単純なアクセスログをそのまま保存するではなく追加情報を添加してみたり、あるいはアプリケーションから直接ログを吐いてそれらをデータウェアに投げ込んで･･･というのも当然のように行うようになりましたね。しかしあまり自由度のない access_log の combined フォーマット。さてどうしたもんか･･･ここで id:stanaka の登場です。 Labeled Tab Separated Valueというのは、はてなで使っているログフォーマットのことで、広く使われているTSV(Tab Separated Value)フォーマットにラベルを付けて扱い易くしたものです。はてなでは、もう3年以上、このフォーマットでログを残していて、one-linerからflue

yogasa 2013/02/09

リンク

LTSV FAQ - LTSV って何? どういうところが良いの? - naoyaのはてなダイアリー

LTSV って何? Labeled Tab-Separated Values という、テキストのフォーマットの仕様です。CSV や TSV や JSON そのほかと同じ、テキストデータのフォーマット名。主にログ、特に httpd のアクセスログなどに適用すると便利です。仕様は http://ltsv.org にまとまっています。随時更新中です。 LTSV は単なるログのフォーマットであって、それ以上でもそれ以下でもありません。 LTSV ってタブ区切りで値に名前を付けただけのもの? はい、そうです。これが 127.0.0.1 - frank [10/Oct/2000:13:55:36 -0700] "GET /apache_pb.gif HTTP/1.0" 200 2326 "http://www.example.com/start.html" "Mozilla/4.08 [en] (

yogasa 2013/02/09

リンク

LTSV が行指向な Key-Value フォーマットで捗る話 - naoyaのはてなダイアリー

引き続き LTSV について。Text::LTSV はやってることは単にタブの split でしょうもないのだけど、せっかく作ったんだし何か利用方法はないかなと考えた。 LTSV のログは欠点があってそのままでは見づらいこと。 Text::LTSV でハッシュになるのだから、YAML とかで出力したらどうなるか試してみよう。さらに、YAML に色づけする YAML::Tiny::Color というのがあったぞ。 #!/usr/bin/env perl use strict; use warnings; use Project::Libs; use YAML::Tiny::Color qw/Dump/; use Text::LTSV; while (<>) { my $hash = Text::LTSV->parse_line($_); print Dump $hash; } こんなスクリプ

yogasa 2013/02/09

リンク

combinedに代わるオレ流ログフォーマット - （ひ）メモ

こんにちは、combinedログ撲滅委員会のひろせです。 ApacheのcombinedやNginxのデフォルトのlog_formatは、機械処理(日付でのソートやパース)がしづらい上に、人の目にもあまり見やすいフォーマットとはいえないと思っています。なので自宅のサーバーでは、日付は ISO8601 にする sortコマンドとかで簡単にそぉーっとソートできるようになる日付、レスポンスコード、所要時間とか固定長的なフィールドは左に寄せる URLとかUAとか可変長で長いのは右に寄せるリクエスト(%r)も右に寄せた方ががいいような気がしてきた。。。数値だけだとわかりづらいのでなんとなくわかるようにフィールド名も添えるフィールド名を長くするとわかりやすくなる反面、ログサイズが大きくなるので注意という観点で次のようなログフォーマットにしています、 # Apache LogFormat

yogasa 2012/12/16

log
format

リンク

ログ収集基盤のFluentdとFlume NG、どちらが使いやすい？

ログは、システムの障害解析（デバッグ）や運用モニタリングに使うことを想定して、コンピュータに発生したイベントの履歴を時系列に沿ってファイルに出力したものである。有用なデータではあるが、扱いにくい面がある。そのため、複数のログを突き合わせて分析するといった活用が難しく、従来はもっぱら一つのログを単独で利用するにとどまるケースが多かった。扱いにくい面とは、例えば「ログを一括して処理するには対象ログを各サーバーから収集しなければならない」「ログはサイズが大きくなりがちなので収集する場合は一部を抜き出すなどの加工が必要」といったことである。ログに新たなデータが書き込まれた際に、それを即座に取り出す手段が用意されていないこともそうだ。こうしたログの扱いにくさは、「ログ収集基盤」と呼ばれるソフトウエアを使うことで克服可能である。ログ収集基盤は、複数のログを結び付けて分析する際などに必要な、対象ログ