アクセス解析の仕組みを理解する

アクセス解析の仕組みを理解して、正しい解析方法を選択する
ウェブ解析の方法は大きく分けて3つあります。
・サーバーログ方式
・パケットキャプチャ方式
・ビーコン方式
サーバーログ方式
サーバーログ方式は、文字通りウェブサーバーのログからアクセスデータを解析する方法です。サーバーのアクセスログは、基本的には全HTTPトラフィックに関して残っており、その量は膨大なものとなります。そこから必要なデータだけを抽出する必要があります。そのため、通常は生データをそのまま扱うことはなく、ログ解析用のソフトウェアを使って解析することになります。
サーバーログ方式は、基本的には全てのアクセスデータを保持しているため、アクセス解析を開始する前のデータでも遡って解析することが可能です。
また、全てのサーバーリクエストについて解析が可能なため、例えばPDFファイルのダウンロード計測、動画の閲覧回数なども解析することができます。
検索クローラボットの動きなども追跡することが可能です。
デメリットとしては、ログデータは膨大な量となるため、データハンドリングが難しくなるケースが多い点があります。複数のウェブサーバーを稼働させている場合には、サーバーの台数分のデータが必要になります。
また、サーバーへのリクエストに基づいてデータが残るため、例えばJavaScriptでのみ発火するアクションなど、クライアント側で完結するようなアクションについては、アクセスデータとして残りません。この場合は別途解析の仕組みを構築する必要があります。
パケットキャプチャ方式
パケットキャプチャ方式とは、ネットワーク上にパケットキャプチャサーバーを設置し、パケットを収集することでアクセスデータを解析する方法です。
ネットワーク上に流れるパケットをそのまま解析に使用できるため、リアルタイムのアクセスデータを得ることができます。
また、ウェブサーバーが複数台ある場合でも、ネットワーク上の位置が同一のセグメントに存在する場合には、同じパケットキャプチャでデータが収集できるため、複数台のサーバーアクセスデータを統合する必要がなくそのまま解析することができます。
デメリットとしては、やはりパケットキャプチャを設置するコストがかかるという点があげられます。
また、JavaScript等でクライアント側で完結するアクションについてはネットワーク上にパケットが流れないため、計測することができません。ブラウザのキャッシュ機能が使われた場合も、同様の理由で計測が不可となります。
ビーコン方式
ビーコン方式は、ウェブサイトのHTML内にアクセス計測用のJavaScriptコードを埋め込むことでデータを収集する方式です。
特別な機器が必要なく、JavaScriptコードをHTMLに埋め込むだけで計測できるため、導入のためのコストが低くなります。
また、サーバーが複数台稼働している場合でも、同じウェブサイトのデータとして扱われるため、統合処理をする必要がありません。
デメリットとしては、ウェブサイトの構成によっては、計測用のコードを埋め込むことができない場合もあるという点です。
またビーコン方式は、計測用タグを埋め込んだ後のデータしか取扱うことができません。過去に遡ってデータを解析することができません。
ビーコン方式においても、クライアント側で完結するアクションについてはそのままでは計測することができません。この場合はイベントトラッキング設定(特定のボタンに対するクリックイベント収集)を行うことで、データ収集が可能になります。
以上のように、アクセス解析にも様々な方式があります。もっとも一般的なのはビーコン方式ですが、デメリットもあります。
解析の目的やウェブサイトの規模によって、正しい解析方法を選択することが重要となります。