タグ

2008年3月31日のブックマーク (6件)

  • Apache Combined Log を効率的にパースする正規表現メモ, Apache Combined Log 解析正規表現ベンチマークの補足 (2007/10/05), Apache Combied Log を解析する CPAN .. - [ぴ](2007-09-07)

    _ [システム運用][Perl] Apache Combined Log を効率的にパースする正規表現メモ ググるとよく見つかるのははてな - Apache形式のログを解析する正規表現を教えてください (Geekなぺーじ : アクセスログの読み方(apache combined logの場合)) の ($host, $ident, $user, $time, $request, $status, $bytes, $referer, $agent) = ($line =~ /^(.*) (.*) (.*) \[(.*)\] "(.*)" (.*) (.*) "(.*)" "(.*)"/); だが、最長一致の .* が多数登場するためか、マッチ処理がとても遅い。たった10万行パースするのに Core2 使って23.7秒ってあり得なくね? できるだけ最短一致でマッチさせるように ($host,

    Apache Combined Log を効率的にパースする正規表現メモ, Apache Combined Log 解析正規表現ベンチマークの補足 (2007/10/05), Apache Combied Log を解析する CPAN .. - [ぴ](2007-09-07)
  • 【apache】perlスクリプトを利用してログファイルを解析する

    はじめに Webサーバを運営する上で、実際のアクセスがどれくらいあるのか、アクセスにどのような傾向があるのかを調べることは非常に重要です。 しかしながら、apacheのログはアクセスのあったURLや時間などの情報を都度保存するだけなので(まあそれがログなんですけど)、それだけではアクセスの傾向や分布等が把握しづらかったりします。 このページでは、perlスクリプトを利用してapacheのログを解析する方法について説明します。 combined形式のフォーマット apacheをデフォルトの状態で導入した際のログ出力(CustomLog)は、combined形式になっています。

  • (高速に)Apache の log を解析する正規表現(追記あり) : a++ My RSS 管理人ブログ

    ※(多分)最終バージョンはこちらです。 ⇒[ぴ] - Apache Combined Log を効率的にパースする正規表現メモ , Apache Combined Log 解析正規表現ベンチマークの補足 (2007/10/05) ※ベンチマークありがとうございました。 ネタ的には既出なんですが・・・ Ref: [ぴ] - Apache Combined Log を効率的にパースする正規表現メモ グーグル先生でよく教えてもらえる正規表現というのがありまして、 !^(.*) (.*) (.*) \[(.*)\] "(.*)" (.*) (.*) "(.*)" "(.*)"! これ、使ってみると 1万行解析するのに 7.617 秒かかりました。ありえない。(Let's note T5 / CentOS) で、バックトラックかからないよう、例えばこんな感じに適当に変更: !^([^\s]*) [^

  • アクセスログ解析

    webページ(ホームページ)は、ユーザに見せるための物です。 ユーザが何を求めてホームページに来たかを把握できればより良いホームページが製作できます。 ユーザがホームページを訪問するとアクセスログと呼ばれる記録が残ります。 ここでは、そのアクセスログを解析することにより色々な情報を引き出す方法を説明したいと思います。 ただし、ここで説明する方法は多少特殊かも知れません。 一般的には世の中にあるツールを使ってアクセスログ解析を行いますが、ここでは、生のアクセスログから情報を抽出する方法を説明して行きたいと思います。 もしかすると、アクセスログの読み方、ツールの作り方に近いかも知れません。 アクセスログからわかること アクセスログを解析すると以下の事が解ります。 どのページが閲覧されているか ユーザはどのような順番でページを閲覧しているか どのような場所からホームページにたどり着いてきたか 何

  • JAM LOG : KinoWiki

    先日静かに(?)オープンしたLoggix Projectですが、オープンするにあたっては色々紆余曲折がありました。その一つは、コミュニケーションの場を自前でフォーラム機能を実装するか、Wikiにするか、というものでした。 フォーラムや掲示板機能は、基的にデータベースがユーザーテーブルひとつあれば作れるのでLoggixに実装しているloggix_commentテーブルを使って作ることが出来ます。(実際、P_BLOG ProjectのフォーラムもP_BLOGのコメント用テーブル一つで作ってます) 参照:Loggix Project Wiki:マニュアル/loggix.sqlite.dbデータベースの構造 なので、loggix.sqlite.dbをコピーして/modules/forum/とか別ディレクトリを作ってそこで構築したりすればいいのですが、マルチスレッド形式のフォーラム機能はそれなりに

    d4-1977
    d4-1977 2008/03/31
    KinoWiki
  • 不機嫌な職場 - 勢川びきのX記 (4コマblog)

    J.Feelの高橋克徳さんも著者の一人であるこの(下↓)を読んで。確かに日の職場はどんどん不機嫌になっていっている。(そう感じている人にお薦めの。なんとかなると元気づけてくれます。) 4コマのネタのグラフは、私自身のシリコンバレーでの駐在体験から。私の上司でもあったPさんからいつも聞かされた言葉は「What's your dream? (Answer) I see. Then, what will you do next Monday?」 (「君の夢は何?」(答えると)「OK、じゃ、来週の月曜日には何をする?」) 不機嫌な職場~なぜ社員同士で協力できないのか (講談社現代新書) 作者: 河合太介,高橋克徳,永田稔,渡部幹出版社/メーカー: 講談社発売日: 2008/01/18メディア: 新書購入: 17人 クリック: 333回この商品を含むブログ (212件) を見る *昨年11月に

    不機嫌な職場 - 勢川びきのX記 (4コマblog)
    d4-1977
    d4-1977 2008/03/31
    不機嫌な職場~なぜ社員同士で協力できないのか