manekineko倉金家ホームページ

趣味の部屋/サーバー構築メモ その2

Webalizer

2010年11月25日(木) 2010年11月30日(火)更新
ホームページのアクセス解析にWebalizerというソフトを導入。
アクセスをグラフ化してみることができ、アクセス状況がたいへんわかりやすくなります。

ホームページを作っているとどんなアクセスがあるかはちょっと気になるところ。
またどのようなブラウザが多く使われているかなど作成の参考にもなります。でも生ログを見てもなかなか傾向まではわかりません。
Webalizerはアクセスを統計処理し、グラフ化してくれますのでとてもわかりやすくなります。

インストール
Webalizer-2.01がすでにインストールされていました。
現時点での最新バージョンは2.23のようですが、今入っているバージョンでいいことにします。

設定
設定ファイルは/etc/webalizer.conf
ディフォルトのままでも充分ですが少し追加など。

LogFile          /var/log/httpd/access_log …解析するログ
OutputDir        /var/www/usage …結果を出力する場所
HistoryName      /var/lib/webalizer/webalizer.hist
Incremental      yes
IncrementalName  /var/lib/webalizer/webalizer.current
  …古い結果に新しい情報を追加していく設定
PageType         htm*
PageType         php
  …ページとみなすファイルの拡張子
DNSCache         /var/lib/webalizer/dns_cache.db
DNSChildren      10
  …DNSをキャッシュして処理を高速化する設定

HTMLHead <META http-equiv="Content-Type" content="text/html; charset=UTF-8">
HTMLHead <META NAME="author" CONTENT="The Webalizer">
HTMLHead <META name="robots" content="noindex,nofollow,noarchive">
  …METAタグは特になくてもいいけど。公開するなら検索ロボットに制限を課しておかないとインデックスされてそれをもとにスパムアクセスを受ける可能性があります。

Quiet            yes  …エラー等のメッセージは出力しない
FoldSeqErr       yes  …httpサーバーのsequence errorは無視

TopReferrers      0  …rferer spamが多い場合refererは無視
TopUsers          0  …もちろんユーザ名など表示しない

HideURL          *.gif
HideURL          *.GIF
HideURL          *.jpg
HideURL          *.JPG
HideURL          *.png
HideURL          *.PNG
  …画像ファイルへのアクセスは集計に含めない
IgnoreURL      /webalizer/*  …webalizer自身へのアクセスは無視

SearchEngine    yahoo.com       p=
SearchEngine    altavista.com   q=
SearchEngine    google.com      q=
SearchEngine    eureka.com      q=
SearchEngine    lycos.com       query=
SearchEngine    hotbot.com      MT=
SearchEngine    msn.com         MT=
SearchEngine    infoseek.com    qt=
SearchEngine    webcrawler      searchText=
SearchEngine    excite          search=
SearchEngine    netscape.com    search=
SearchEngine    mamma.com       query=
SearchEngine    alltheweb.com   query=
SearchEngine    northernlight.com  qr=
SearchEngine    google.co.jp    q=
SearchEngine    yahoo.co.jp     p=
SearchEngine    yahoo.co.jp     q=
SearchEngine    infoseek.co.jp  qt=
SearchEngine    excite.co.jp    search=
SearchEngine    goo.ne.jp       MT=
SearchEngine    msn.co.jp       q=
SearchEngine    search.nifty.com  Text=
SearchEngine    biglobe.ne.jp   q=
  …検索エンジンとキーワードクエリーの指定。日本のを追加。

テスト
ためしに起動してみます。
# webalizer
...だめなようです。
Warning: Truncating oversized username
Skipping bad record (1)
....(ログの行数だけ繰り返し)
となり、解析結果がつくられません。
理由はすぐわかりました。httpdのアクセスログのLogFormatを見やすいようにと変更してしまっていたからです。
元に戻していったんログを消去し、ログのたまるのをしばらく待って再度起動。こんどはちゃんと解析結果が作られグラフにもなっていました。まだサーバー公開はしていないので自分のアクセスしか記録されていませんが。
あとはサーバー公開をしてから見て微調整することにします。

OutputDirの/var/www/usageをホームページの表示ディレクトリ(私の場合/home/http)にリンクし、名前をwebalizerとでも変えておきます。
→ 設置したWebalizer (期間限定特別大公開)
またこのサイトに使っているホームページプログラム"IRORIBATA"にも簡単なログ機能があり、これと併せて見ることにより、かなりサイトへのアクセス状況がわかりやすくなります。
→ "IRORIBATA"のアクセスログ (特別大公開)