SEO的コンテンツ最適化のためのベストプラクティス(後編)
この記事は前後編に分けてお届けしている。コンテンツの構造について説明した前回に引き続き、今回お伝えするのはコンテンツの内容に関する問題だ。
コンテンツの独自性と内容の深さ
今回のコンテンツ最適化の話で、最も重要な部分をこれから説明する。読み応えがあり、新たな価値を追加する独自のコンテンツに対して検索エンジンが重きを置くことに、ほとんど議論の余地はない。特にグーグルは、これまでに何回か「コンテンツの質が低い」サイトをインデックスから追放したことがあり、他の検索エンジンもこれに追随している。
まず第一に避けるべきは「薄いコンテンツ」だ。薄いコンテンツというのは業界用語で、(大ざっぱに言うと)ページ中に独自な要素が不十分なため、検索エンジンが検索結果に優先的に表示するほどの価値を認めないコンテンツを指す。あるページを検索エンジンが独自コンテンツだとみなす基準が公式に明らかにされたことは一度もないが、僕がエンジニアからいろいろな例や議論を見聞きしたことをもとに、リストアップしてみよう。
他のサイトやページにはない独自の解析可能な文を構成する30~50ワード程度の独自の言葉
同じサイトの他のページから主な動詞と名詞を変えた以上の違いを持つ、独自のHTMLテキストコンテンツ(そう、つまりページをコピーして市とか州とかの名前を変えただけなら、「独自」だとは見なされない)
独自のタイトルタグ(title要素)とメタタグ(meta要素)。独自のメタタグが書けないなら、最初から入れない方がいい。類似性アルゴリズムがメタタグのよく似たページを見つけて、インデックスから追い出したのを見たことがある。
独自の動画/音声/画像コンテンツ:垂直検索で「独自性」の基準を一般に満たしているか否かを見極め、ページを判別しインデックス化することに関して、検索エンジンは次第に賢くなってきている。
とはいえ、こういった制限に触れていても問題ないことが往々にしてある。その条件としては、第1に、当該ページに張られた価値の高い外部リンクが多数ある場合だ(ただしこれは、計測することがほとんど不可能だ)。第2に、自分のサイトが非常に強力で権威がある場合だ(Wikipediaで1行しか内容のないスタブページの非常に多くが、依然として高い検索順位を保っていることからもわかる)。
検索エンジンが求めらる次の基準は、Webサイトは自らが公開するコンテンツに「価値を追加する」べきだという点。(全体または部分的に)他のサイトのコンテンツを利用したコンテンツの場合は特にそうだ。この基準に最もよく引っかかるのがアフィリエイトサイトで、商品説明や画像などの使い回しが、何度となく検索エンジンから目の敵にされてきた。実のところ、僕らは最近いくつかのサイトでこの問題に対処してきて、出した結論は、たとえそれまでアルゴリズムの掃射をかわしてきたとしても、ここでは人手による評価で先手を打つのが最良だ、というものだった。基本的な指針は次の通り。
君のサイトがユーザーに相当大きな価値を与えているのでもない限り、ウェブのどこかで見つけたものをコピーして再公開するのは止めること。
アフィリエイトコンテンツをホストしている場合、他のサイトより厳しく審査されるのを覚悟すること。検索結果にアフィリエイトサイトがあるのは、検索エンジンに関するユーザーの不平で特に多いものだ。
数件のコメント、賢いソートアルゴリズム、自動化されたタグ、フィルタリング、1~2行のテキスト、広告といった些細なものは、「実質的な価値」と見なされない。
このような指針を守っている模範的Webサイトな例としては、CNETのレビュー(例)、UrbanSpoon(例)、Metacritic(例)などがある。他のサイトからコンテンツ・商品・レビューを転載しながら、ユーザーのために情報の集積に加えて「価値の追加」を行っている。
最後だが他に劣らず大事なものとして、僕たちがグーグルから得た奇妙な(そしてあまり知られていない)ガイドラインがある。具体的には、「検索結果の中に検索結果が表示されること」を避ける、というものだ(さらに詳しい情報は、グーグルのWebSpam Chiefによるこの記事(英語)を、コメント欄と共に参照のこと)。
グーグルが明らかにしている意見は、一般的に検索結果ページはユーザーにとって「価値を追加しない」というものだが、これは単に反競争的な動きだという異議も一部から出ている。動機が何であれ、SEOmozでも、多数のサイトの「検索結果」を取り除いて「より価値の高い」リストに作り変え、「カテゴリ/サブカテゴリ」という形のランディングページに変身させたことでグーグルにおける検索順位を回復し、グーグルからのトラフィックを増やすことができたことがある。
ただし基本的には、検索結果だと見なされる(検索エンジンのアルゴリズムからだけでなく、エンジニアや品質評価担当者からも)リスクは避けたいはずだ。次のような行為は慎むこと。
ページのタイトルや見出しに「検索結果」や「結果」という言葉を入れること
検索条件に「適合する」サイト内ページへのリンクの一覧を提供するだけで、他にコンテンツがないように見えるページ(これを避けるために、短い文章や画像を添えたり、「結果」が詳細な説明やリンク集に見えるようなフォーマットを加えると良い)
検索クエリから生成されたように見える文字列をURLに含むページ。たとえば、「?q=seattle+restaurants」は避けるべきで、「/seattle-restaurants」の方が良い
奇妙に思えるかもしれないが、これらの小さな、主に見かけ上の変更で、インデックス化されるか除外されるかが変わってくる。用心には用心を重ねて、検索結果に見えないようにしよう。
ソーシャルもやってます!