③ 自動化スクリプトを作成する
200番台のHTTPステータスコードを返す404ページ
SEO業界で有名なSearch Engine Roundtableのバリー・シュワルツ氏は、404ページが200番台のHTTPステータスコードを返す(ソフト404)べきではないという内容のブログ記事を書いた。その理由について、確かに存在してはいるがコンテンツのないページをクロールすることになり、スパイダーを混乱させてしまうからだとしている。
こうした状態がサイトに存在していると、時間が経つにつれて検索順位にも影響を及ぼす可能性がある。なぜなら、ロボットが同じコンテンツを持つ異なるURLを何回も繰り返しクロールするので、膨大な量の重複コンテンツを作り出してしまうからだ。
シュワルツ氏はさらに、このタイプの問題をチェックするために、自動化スクリプトの作成も提案している。
しかし、自分のサイトでこの問題がどの程度まで広がっているかをまず判断し、200番台のステータスコードを返す404ページの数をざっくりと把握するには、グーグルで次のような検索クエリを打ち込めばいい。
このクエリで結果が返ってきたら、自分のサイトにある404ページが200番台のHTTPステータスコードを返しており、修正する必要があるとわかる。
SEOスコアカード
私は以前にも、SEOスコアカードの作成について記事を書いたことがある。
つい先日も、何十万というURLを持つ顧客に対して、記事で紹介したのとは少し違うSEOスコアカードの作成を薦めた。この顧客が苦労していたのは、高品質の重複していないコンテンツのみを確実にインデックス化してもらうことだ。Eコマースサイトを運営する顧客だったので、そのサイトには似たような製品が山のようにあった(そのせいで、サイト内にまったく同じような製品説明やコンテンツがたくさん掲載されていた)。
そこで私が提案したのは、毎月自動的に実行される内部スコアシートを作成することだ。これによって、現在インデックス化されているページが高品質という評価を保っていることを確認すると同時に、一度は低品質だと判断されたページを定期的に見直す機会も得られる。低品質だと判断されたページも、質が上がれば、自動的にインデックス化されることになる。
このプロセスはサイトマップの生成にも利用できる。けれども、目標はあくまでも、サイトの全体的なドメイン・オーソリティを向上させつつ、検索エンジンの将来的なアルゴリズム変更に備えて、サイトを変化に耐えられるものにしておくことだ。
SEOスコアシート作成時に注意すべき項目はいくつかあるが、そのなかでも「noindex」を指定したページの扱いには留意したい。特に時間が経った場合、そのせいでサイトのインデックス化率が下がってしまう可能性があるからだ。最初のスクリプトができたら、結果をチェックして本当にnoindex指定すべきページかどうかをよく確認しよう。そうなっていないなら、そのスクリプトは書き直しが求められるかもしれない。
究極の目標は、質の高いページだけを確実にインデックス化してもらう一方で、サイト上にユニークなコンテンツを必要とするページがどれだけあるかを把握することだ。こういうことを知っておけば、サイトのリンク構築戦略やコンテンツ戦略を練るときに役立つ、ということがわかってくるだろう。
結論
全体としての目標は、サイトをテクニカルに監査する合理化されたプロセスを構築することだ。そのプロセスは、目に見える記録として残り、社内で情報を共有できるものでなければならない。より効率のよいプロセスができれば、他の重要な要素、たとえば質のよいコンテンツ作りやオンラインコミュニティの構築、ソーシャルメディアの利用などに、より多くの時間をかけられることになる。
ソーシャルもやってます!