URIPATH (?:/[A-Za-z0-9$.+!*'(){},~:;=@#%_\-]*)+ WORD \b\w+\b NUMBER (?<![0-9.+-])(?>[+-]?(?:(?:[0-9]+(?:\.[0-9]+)?)|(?:\.[0-9]+))) ACCESS_LOG %{URIPATH:request} %{WORD:method} %{NUMBER:duration} パターン名のあとにスペースをあけてパターンを記述します。パターンは正規表現で記述できます。 パターンの中で%{パターン名:id}と記述することで、パターンを再利用することができます。 idはパターンにマッチした文字列を取り出すための識別子になります。パターンにマッチした結果を利用しない場合はidに"UNWANTED"を指定します。 なお、パターンファイルは自分で書かなくても、汎用的なものをlogstashの
こちらのエントリを見て、EmbulkでApacheのログをパースするのにgrokというものがあることを知りまして。 EmbulkでアクセスログをLogstash風に取り込む - 見習いプログラミング日記 grok自体、知らなかったです…。 正規表現がベースになっているようですが、パターンに名前を付けて繰り返し利用できるところがポイントみたいです。 なお、自分が前にEmbulkでApacheログをパースした時は、embulk-parser-grokではなくてembulk-parser-apache-custom-logを使っていました。 https://github.com/arielnetworks/embulk-parser-grok https://github.com/jami-i/embulk-parser-apache-custom-log embulk-parser-grokの
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く