Moz - SEOとインバウンドマーケティングの実践情報

「SEOの意外な裏技」その10:robots.txtでリンクジュースの受け渡しをうっかりブロックしないために

robots.txtでdisallowするだけでは、ページはインデックスに含まれ、リンクジュースの流れを阻害する

自分のドメイン名にあるページにロボットをアクセスさせないための手段として、robots.txtを採用しているWebサイトが結構ある。確かにいいやり方だけど、僕らの元に寄せられる質問を見ていると、robots.txtを使ってグーグルやヤフー、MSNといった検索エンジンのロボットを排除するとは一体どういうことなのかってことに関して、少々誤解があるようだ。以下に、ロボットの排除方法をざっと分類してみよう。

  • robots.txt ―― URLへの訪問はさせないが、URL自体をインデックスに取り込んで検索結果ページ(SERP)に表示するのは許可する(よくわからない人は、下の例を見てほしい)。

  • メタタグ(meta要素)のnoindex ―― 訪問は許可するが、URLのインデックス化や、SERPへの表示はさせない。

  • nofollow属性の付いたリンク ―― 賢いやり方ではない。あるリンクにnofollowを付けても、他にnofollowの付いていないリンクがあれば、そのリンク先ページはインデックス化されてしまうからだ(ページのリンクジュースを「無駄」にしないためにこの方法を使うのならいいけど、その場合は、この方法でロボットを排除できるとか、SERPへの表示を防げるとは思わないことだ)。

以下は、robots.txtでロボットを排除しているのに、グーグルのインデックスには含まれているページの一例だ。

「about.com」のrobots.txtファイル
このrobots.txtが、「about.com」の他のサブドメイン全体にも適用されている点に注目。

見ての通り、about.comは「/library/nosearch/」というフォルダにロボットがアクセスすることを明らかに禁じている。なのに、グーグルでこのフォルダのURLを検索すると、こんな結果が返ってくるんだ。

ロボットを排除している「about.com」のURLをグーグルで検索した結果

グーグルは、この「ロボット排除」を行っているディレクトリから2760件ものページを見つけ出している。これらのURLはクロールされていないわけだから、検索結果にはアドレスのみが表示される(グーグルはページの内容を見ることができないから、タイトルや説明などは付かない)。

ここで、もう一歩踏み込んで考えてみよう——検索エンジンの目に触れないようにしたページがあったとしても、それらのURLはリンクを獲得し、リンクジュースをはじめとするクエリ非依存型の順位決定要素を貯め込むことができる。でも、そこから外部へのリンクが検索エンジンの目に触れることはないんだから、これらのURLには貯め込んだものを「引き渡す」方法がないことになる。この状況を図で表すとこうだ。

グーグルは、robots.txtによってアクセスが禁じられているページを見ることができない

大事なのは次の2点だ。

  1. robots.txtによってロボットを排除しているURLにリンクする場合は、nofollowを使ってリンクジュースを無駄に流さない。

  2. ロボットを排除しているページが(特に外部リンクからの)リンクジュースを獲得していることがわかっている場合は、robots.txtではなくメタタグ(meta要素)を使って「noindex, follow」を指定し、自サイトの必要な場所にリンクジュースを渡す方法を検討する。

※Web担編注

あるページをrobots.txtでdisallowするとクロールは禁止できるがインデックスは禁止されないため、リンクジュースの流れをコントロールしたければ、disallowしているページに対して、他の方法でインデックス自体を禁止するべきだという記事。

グーグルはrobots.txtでnoindexを指定することでインデックスを禁止できることを明らかにしているので、metaタグでnoindexを指定できない場合などは、この手法を使うのがいいだろう。

5月18日からのSMX Londonでみんなに会えるのを(それから、19日のウィルと僕のプレゼンも)楽しみにしているよ!

追伸:アンディー・ビアード氏が以前、このトピックについて「SEOのプロでも引っ掛かるリンク構築の落とし穴」という信頼できる記事を書いている。

この記事が役に立ったらシェア!
みんなが読んでるWeb担メルマガで、あなたも最新情報をチェック
  • SEOやデジタルマーケの最新情報をゲット
  • 事例やインタビューも見逃さない
  • 要チェックのセミナー情報も届く
みんなが読んでるWeb担メルマガで、あなたも最新情報をチェック
  • SEOやデジタルマーケの最新情報をゲット
  • 事例やインタビューも見逃さない
  • 要チェックのセミナー情報も届く

Web業界の転職情報

もっと見る
Sponsored by

人気記事トップ10(過去7日間)

今日の用語

トップレベルドメイン
インターネットのDNSで利用されるドメイン名のドット(.)以降に示される文字列。 ...→用語集へ

連載/特集コーナーから探す

インフォメーション

Web担のメルマガを購読しませんか?
Web担の記事がコンパクトに毎週届くメールマガジン「Web担ウィークリー」は、10万人が読んでいる人気メルマガ。忙しいあなたの情報収集力をアップさせる強い味方で、お得な情報もいち早く入手できます。

Web担に広告を掲載しませんか?
購読者数10万人のメールマガジン広告をはじめとする広告サービスで、御社の認知向上やセミナー集客を強力にお手伝いいたします。

サイトマップ
RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]