Webサーバを運用する上でどのようなIPからどのようなアクセスがあるかを知っておくことは重要な事です。 最近ではGoogleアナリティクスなど高性能なツールでウェブブラウザからのアクセス分析をすることが可能になりましたが、ホスト名・IP毎に詳細に見ていく場合はやはりWebサーバのアクセスログを直接集計することが必要です。 特にJavaScriptが動作しないクローラーやCurl、WgetなどのコマンドでのアクセスはWebサーバのアクセスログを直接参照する必要があります。 今回はクローラーやコマンドなどのウェブブラウザ以外からのアクセスも含んだWebサーバのアクセスログから日別、ホスト名・IPアドレス毎にアクセス数を集計するシェルスクリプト(バッチ処理プログラム)を備忘録として記載します。
![Apache Webサーバのアクセスログから日別、ホスト名・IPアドレス毎にアクセス数を集計するシェルスクリプト(バッチ処理プログラム) ~JavaScriptが動作しないクローラー、コマンドでのアクセスにも対応したログファイルを用いた集計方法~ | Magtranetwork マグトラネットワーク](https://cdn-ak-scissors.b.st-hatena.com/image/square/c53fe7c88acbf1c7ae2bc6dfad24cef782dfc32b/height=288;version=1;width=512/https%3A%2F%2Fwww.magtranetwork.com%2Fwp-content%2Fuploads%2F2021%2F03%2Fog-h200.png)