衣袋宏美のデータハックス

URLが2つあるトップページへのPV数は正しくカウントされているのか? [アクセス解析Q&A]

「/index.html」で終わるトップページのURLが、解析ツールに記録されていない場合の対処法。
衣袋宏美のデータハックス

質問:私のサイトのトップページにはURLが2つあり(「http://www.example.co.jp/」と「http://www.example.co.jp/index.html」)、どちらのURLを入力しても、アドレスバーにはそのまま表示されます。しかしアクセス解析ツールのページビュー数のレポートには「http://www.example.co.jp/」しか出てきません。「http://www.example.co.jp/index.html」のページビュー数がカウントされてないのではないかと心配です。どういうことなのでしょうか?

答えURLがどう表示されるかはサーバーの設定によりますが、アクセス解析ツールは「http://www.example.co.jp/index.html」と「http://www.example.co.jp/」が同じページであるとみなして、2つのページビュー数をまとめて「http://www.example.co.jp/」と表示をしているので、ページビュー数のカウント漏れの心配はありません。

解説まず表示するWebページの特定をするために使われるURLの構造について説明しよう。

URLの構造
URLの構造

お尋ねいただいているWebページの場合、プロトコルが「http」、ホスト名が「www」、ドメイン名が「example.co.jp」、ポート番号はなし、パス名が「index.html」、クエリーストリングはなしとなる。

たいていのサーバーでは、「http://www.example.co.jp/」(パス名なしのURL)へアクセスがあったときに、表示するファイルを探して表示するようになっていて、通常は「index.htm」もしくは「index.html」などのパス名(ファイル名)を持つページが優先的に表示される。つまり、「http://www.example.co.jp/」でリクエストがあったときにも、パス名は表示されていないが、自動的にindex.htmlというファイルが表示されているのである。つまり「http://www.example.co.jp/index.html」と「http://www.example.co.jp/」が同じファイルを呼び出して表示しているので、サイトの「トップページ」はどちらのURLを指定しても同じ内容ということだ。

パス名ありのURLがリクエストされた際に、パス名ありのまま表示するか、パス名なしのURLに一元化するかはサーバーの設定によるのだが、これは本稿の最後で改めて説明する。

アクセス解析ツールでの処理

サーバーログ型のアクセス解析ツールでもJavaScriptタグ型のツールでも、この問題は適切な設定を行うことで別々に集計したり、まとめて集計したり、自分の好きなように集計することが出来る場合が多い。

サーバーログ型なら、リクエストされたファイル名が集計されるので、そのまま別々に見たければ特に何も指定しなければよいし、「http://www.example.co.jp/index.html」(あるいはindex.asp、index.htmなど何でもいいが)と「http://www.example.co.jp/」を統合した集計データを見たければ、そのファイル名のパターンを登録することで、表示上「http://www.example.co.jp/」に統一する設定を行うことができる。

JavaScriptタグ型なら、アドレスバーに表示されたURL情報を取得するのが普通である。「index.html」ありとなしとどちらのパターンでも表示される場合、こちらもそれらを統合した数字を見たいのであれば、そのような設定を用意しているツールなら、合計した数字だけを確認するようにすることができるはずだ。

この「index.html」ありとなしの問題は、サイトのトップページだけでなく、「http://www.example.co.jp/z/」といったディレクトリのトップページにおいても事情は同じで、上記の設定を1つしておけば、各ディレクトリなど下の階層についても同様の処理が行われるのが一般的だ。

サーバーの設定での表示処理

さて読者の方は、「http://www.example.co.jp/index.html」へのアクセスがあったときに、最終的に「http://www.example.co.jp/」がURLとして表示されることもあることはご存知だろう。こちらは上記と混同しやすいが、サーバーの設定という別の話だ。これは1つのコンテンツを2つのURL表示で表すと、リンクが分散して検索エンジン対策上好ましくないので、サーバー側の設定で表示を1つに統一するものだ。

具体的には「http://www.example.co.jp/index.html」にアクセスした場合、「http://www.example.co.jp/」に「301リダイレクト」などの方法を使って転送する仕組みを使う。この「301リダイレクト」は、検索エンジンにURLは完全に移転したことを伝え、リンクを旧URLからリダイレクト先のURLに引き継がせるものだ。「301リダイレクト」については、「SEOmoz」の「URLリライトと301リダイレクトの仕組み」でも詳しく取り上げているので、興味のある方はご覧いただきたい。

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

DRM
「DRM」は主に以下2つの略語のこと。 ■ダイレクトレスポンスマーケティン ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]