
このページは、外部サイト
CyberAgent SEO Information の情報をRSSフィード経由で取得して表示しているため、記事の一部分しか表示されていなかったり、画像などが正しく表示されなかったり、オリジナル記事が意図したデザインと異なっていたりする場合があります。
完全な状態のオリジナル記事は 「
#(ハッシュ)付のURLもGoogleはインデックスする??」 からご覧ください。
息抜き程度の記事です。
Ajaxでウェブサイトを構築する際などに、URLに#(ハッシュ)が入ってしまうことが良くあると思います。
GoogleはURLに#(ハッシュ)が入っていると、#以降をインデックスしないはずでしたが・・・

あれ?ハッシュバンもしていないのにインデックスしている?
でもこれはsite:で検索したものなので、それでかもしれない。
なら、ウェブページの文言で引っ張ってみよう。

※いずれも画像が汚くなってしまいすいません
そもそも#以降をインデックスしないというのは私の思い違いだったのだろうか・・・。
しかし、#はページ内リンクにも用いられますので、#以降もインデックスしてしまうと同一ページで複数URLをインデックスしてしまうこともあるはず。
(そんなものGoogleの技術からしたらはじけるでしょうけど)
いろいろな人にも聞いてみましたがはっきりしたことは分かりませんでした。
このサイト以外でもURLに#を含んでいるもののインデックス状況を調べてみましたが、
インデックスされているものは見つかっていません。
仮説として
・「/#」という形の場合はインデックスする
・リンクの張り方によってはインデックスする
あたりでしょうか?
再現できているものが他に見つからないので今は検証ができていませんが・・・。
GoogleはAjaxやFlashなどの非同期コンテンツもインデックスするように開発を進めている
という噂は昔から何度も聞いていることです。
すでにビジュアルベースでのコンテンツ把握はできていると思われるので(ページレイアウトアルゴリズムなどもその一環でしょうし)不可能ではないと思います。
ただ、それにしても今回のような事例が他に出て来ないのです。
なぜこのサイトだけ#以降もインデックスされてしまっているのか?
完全にただの興味本位ではありますが、もう少し調べてみようと思います。
また、こちらただ単に私が無知なだけかもしれないのでご存知の方はこっそり教えてください。
よろしくお願いします。
木村 賢(Twitter,Google+)