前編・後編の2回に分けてお届けしている。
インデックスの肥大化のよくある原因
よくある原因はいくつか考えられる。「インデックス化されているのにトラフィックを得ていない」という状況は、ほとんどのサイトでは発生しないはずだ。需要に基づいて常にページを見直し、作成する編集方針にしていれば、そんな事態は避けられるだろう。
しかし、実際に多くのサイトで起きていることであり、そのよくある原因は次の2つのグループに分けられる。僕がコンサルタントとしてこれまでに見てきた経験に基づくと、次の2種類がある:
- 「ブログ」や「ユーザー生成コンテンツ(UGC)」
- 「リスティング」や「商品ページ」
それぞれ詳しく説明する。
原因1「ブログ」「ユーザー生成コンテンツ(UGC)」
「ブログ」や「ユーザー生成コンテンツ(UGC)」がある場合、同じようなトピックで内容の薄いページが大量に生成されてしまいがちだ。
僕が以前関わったサイトでは、ビジネスに関する発表を何でもブログに投稿していた:
- 新しいスタッフを採用した
- 新たな支店がオープンした
- 何かの賞をもらった
- クリスマスパーティーをした など
あらゆるプレスリリースやそういった情報をブログに掲載していたため、膨大な数のページがインデックス化されたのだが、そもそも検索トラフィックを獲得する目的で設計されたページは1つもなかった。
同様に、フォーラム(掲示板)のような形でユーザー生成コンテンツ(UGC)を扱っている場合、同じことが起きる。
ユーザーは思いついたことに関するスレッドを立てる(同様のスレッドがすでにあるかどうかを確認しない)。それらすべてがインデックス化される。トラフィックを生み出す可能性はあるが、非常に似通ったトピックに関する内容の薄いURLが大量に生成される事態にもなり得る。
原因2「リスティング」「商品ページ」
2つ目のグループとして思い浮かぶのは、「リスティング」や「商品ページ」だ。次のようなものを考えてみると、大量のページが次々と生成されては消えていく:
- 不動産サイト
- 中古車サイト
- 求人情報の掲示板
- マーケットプレイス
数か月後、それは削除される。常にそのような状況だ。どのページもかなり価値が低く、極めて限定されたページばかりだ。その大多数は、トラフィックを一切獲得しない。
同様に、大規模なeコマースサイトでも、個別の商品ページが大量にある。その一部は極端にロングテールで、他のページと似すぎているため、現実的に考えてトラフィックをまったく獲得できない。
インデックスの肥大化を抑制するには
どちらの場合も、膨大な数のURLを生成しても、基本的にトラフィックが一切得られない可能性がある。では、実際これについて何ができるだろうか。あるいは、そもそも対応すべきかどうかをどう判断すればいいのだろうか。
対策1トラフィックがほとんどないURLを特定する
僕がやる最初のステップは、トラフィックがほとんどないURLを特定することだ。僕の場合は、次のような目安を設けている:
- 1か月あたりの平均クリック数が1回あるかどうか
かなり低い基準にして構わない。上記のような基準でも、大きな影響を受けているサイトならば、ほとんどの場合は文字どおりトラフィックがゼロのページがたくさん抽出されるはずだ。
なお、これをオーガニック検索の視点で見ている場合は、必ず他のチャネルも確認しよう。オーガニック検索トラフィックを得ていないからといって、「ソーシャルチーム」や「電子メールチーム」などにとって重要なページをうっかり削除してしまうことは避けたい。
対策2改善の可能性があるページを修正する
次に、改善の可能性があるページを修正するしよう。これはかなり大ざっぱな言い方だが、特定したページの中には、次のように思われるページがあるかもしれない:
- 以前は多くのトラフィックを集めていたが内容が古くなってしまったページ
- 実は高品質なコンテンツがあるのにテクニカルSEOの問題で十分なパフォーマンスを発揮できていないページ
何らかの手を加える価値があるページを探そう。たとえばそれは、多くのリンクを集めているページかもしれない。こうした潜在的な価値を一掃してしまうのは惜しい。できれば何らかの措置を講じよう。
対策3改善が見込めないページは統合するか、削除する
その結果、トラフィックがまったくなく、何の機会ももたらさないと思われる大量のページが残る。ここではいくつか異なる選択肢があるが、それらを組み合わせて進めるのがいいだろう。
ポイントは、「そのページが対象とする検索意図」と同じまたは似ている設計の既存ページや潜在的ページがあるかどうかだ。そうしたページが存在する場合、基本的には「まとめる」処理をすることになる。
たとえば、非常に具体的な商品ページがあるとしても、基本的にほぼ同じ内容のカテゴリページがあり、商品も在庫切れの場合は「canonicalタグ」か「301リダイレクト」を検討できる。念のために、canonicalと301の使い分けを説明しておこう:
- canonicalはそのURLへのアクセスを維持したい場合に使う
- 301はそのページがまったく不要で、もう誰にも見てもらわなくてよくなった場合に使う
くり返すが、これはページの意図や目的、内容が非常に似通ったものである場合の対応だ。
一部の内容を統合する価値があると思ったら、次の手法も試してみるといいだろう:
- いくつかのページの優れた内容を1ページに集約させて統合する
- 新しいURLにするか、それとも既存のURLにするかは選択できる
この時点で優れたページがなくても問題ない。さほど価値のないこれらの古いページを残しておくより、このトピックについて十分なパフォーマンスを発揮する新規ページを作成するほうがいい場合が多いからだ。
次のようなページでは、404エラーを返すかnoindexを設定する:
- 意図に合わないページ
- 冗長なページ
- いずれにせよ何の価値もなかったページ
念のために、404とnoindexの使い分けを説明しておこう:
- 404は「もうアクセスしてもらう必要がなくなった」ときに適している。
- noindexは、「メールやソーシャルなど他のチャネルなどで使うなどで、今後もページにアクセスできるようにする必要がある」場合に使う。
404やnoindexを指定するのは、かなり極端なやり方であり、できれば避けた方がいいだろう。その理由は、「そのページのリンク価値をグーグルがどう引き継ぐか」にある。
リダイレクトやcanonicalを指定した場合でも、ページが検索意図に十分に合致していなければ、グーグルは必ずしもリンク価値を新しいURLに引き継ぐとは限らない。
しかし、404を使った場合は、「リンク価値は絶対に引き継がれない」からだ。noindexを指定した場合も、最終的には同様だ。グーグルは最終的にnoindexページのクロールを停止する。
これが、404やnoindexを避けるほうがいい理由だ。とは言うものの実際には、それでも404やnoindexにするべきページがいくつか出てくるだろう。
以上が、僕がこれまでに実践してきたプロセスだ。僕自身、この方法で良い結果を得てきた。他の多くのSEO担当者も、特にヘルプフルコンテンツアップデート以降や過去のパンダアップデート関連でこうした方法について話していたし、ほぼ同じような効果があったと思われる。
君もうまくいったかどうか教えてほしい。どうもありがとう。


