衣袋宏美のデータハックス

解析ツールのリンクをクリックするとnot foundになってしまうのはなぜか? [アクセス解析Q&A]

一見正しいURLも、Webサーバーの種類とツールの設定によってはエラーになることがあるその理由とは?
衣袋宏美のデータハックス

質問:アクセス解析ツールに表示されているWebページのリンクをクリックしてもnot foundになってしまいます。URLは正しく表示されているようなのですが、解析しているはずのページが存在しないのはなぜですか?

答えURLの大文字小文字まで正しく表示されているか確認してみましょう。ツールによってはすべて小文字に変換してしまうなどの処理をおこなっていることもありますので、確認してみてください。

解説 アクセス解析ツールが集計のためにURLを処理している場合、それが原因で、アクセス解析ツールが表示する解析対象ページのURLをクリックしても、ページが存在しないという現象が起きます。

大文字/小文字を揃えてしまう場合

まず、表示するWebページを指定するために使われるURLの構造について説明しておきましょう。

Webページの特定をするために使われるURLの構造

URLのなかで、大文字/小文字が区別されない部分と、場合によっては大文字/小文字が異なると別のページとして扱われる部分があります。

プロトコル大文字/小文字が区別されない
ホスト名/サブドメイン
ドメイン名(+ポート番号)
パス名(ディレクトリとファイル名)OSによっては大文字/小文字が区別される
クエリーストリングサーバーで動作しているCGIなどのシステムによっては大文字/小文字が区別される

表で示したように、ドメイン名の部分は大文字/小文字が区別されることはありません。たとえば、http://www.impressrd.jp/とhttp://www.impressRD.jp/は区別されません。

しかし、WebサーバーのOSによっては、パス名(ディレクトリ名とファイル名)で大文字/小文字を区別するため、本来は大文字が使われているディレクトリ名を小文字で指定すると「該当するページはありません(not found)」という反応がサーバーから返されてしまう場合があります。

同様に、クエリーストリングも、利用しているCMSやCGIなどのプログラムによっては大文字と小文字を区別して処理する場合があります。

アクセス解析ツールによっては、大文字/小文字を区別せずに、どちらかに表記を統一するように変換処理する場合があります。この場合、本当のURLと違うものが表示されてしまう場合があるのです。

URLの長さが制限されている場合

他にURLが加工されてしまうものとしては、以前にお話ししたクエリーストリング(パラメータ)部分をすべて削除してしまうといったものに加えて、あまりに長いURLはある一定の長さ(たとえば256文字など)を超えると、それ以降は切り捨ててしまうような処理を行うアクセス解析ツールもあります。

たとえばあるECサイトの場合、扱っている商品が多いため、商品データベースなどと連動して、ユーザーの要求に合わせて、動的にコンテンツを吐き出すような仕組みを利用しており、URLは次のようになっているとします。

http://shop.example.co.jp/shopping/index.cgi?category_id=se&product_id=103

上記Webページの場合、パス名がshopping/index.cgiで、商品カテゴリーや商品を指定するクエリーストリングとしてcategory_id=seとproduct_id=103が指定されています。

セッションIDなど、ユニークなページを意味するという点では関係のないパラメータも含んでいるかもしれませんが、商品カテゴリーなどが多岐にわたるECサイトなどでは、それらをきちんと区分けするための変数が何個もついていて、その結果URLが非常に長いものになってしまう場合があります。

たとえば、Amazonで『Web担当者 現場のノウハウ SEOスペシャル 2009 冬号』のURLは次のようなものになっていて、275文字もあります。

http://www.amazon.co.jp/Web%E6%8B%85%E5%BD%93%E8%80%85-%E7%8F%BE%E5%A0%B4%E3%81%AE%E3%83%8E%E3%82%A6%E3%83%8F%E3%82%A6-SEO%E3%82%B9%E3%83%9A%E3%82%B7%E3%83%A3%E3%83%AB-2009-%E3%82%A4%E3%83%B3%E3%83%97%E3%83%AC%E3%82%B9%E3%83%A0%E3%83%83%E3%82%AF/dp/4844326503/ref=pd_sim_b_1

アクセス解析ツールは「どのページへのアクセスか」を管理するのにURLを使っていますが、処理の都合で各データの長さには制限があるのが普通ですから、長いURLを使っている場合には、お使いのアクセス解析ツールでどういった処理を行っているのか確認するのがよいでしょう。

用語集
CGI / SEO / Webサーバー / アクセス解析 / セッション / ディレクトリ / ドメイン名 / リンク
この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

robots.txt
ロボット型の検索エンジンが自分のページを登録しないようにするためにサイト管理者が ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]