複製コンテンツに対するペナルティなどというものは存在しない、これが経験豊かなSEOマーケターたちにとって一般的な通念だ。一般原則としてこの考えは正しいが、例外もある。言い換えると、特定のケースにおいては複製コンテンツに対するペナルティが確かに存在する。今回の記事ではそのことについて説明していく。
一般の通念
重ねて言うが、複製コンテンツに関してSEOマーケターたちが持っている通念というものは、ほとんどの場合正しい。それは、次のようなものだ。
複製コンテンツは同一サイト内、あるいは異なるサイトにまたがって発生し得る。
まったく同じ内容でなくても、あるページが他のページの複製コンテンツだと見なされる場合もある。
検索エンジンはインデックス内の特定のコンテンツについて、1つのバージョンだけを検索結果に表示したいと考えている。これは検索エンジンにとって根本的な命題だ。なぜなら、もしユーザーが検索結果を得て、そこからあるページにアクセスし、それが求めている情報ではないと判断して再び検索し、別のページにアクセスしたところ、それが前のページの複製だったらユーザーにとって無益だからだ。
つまり基本的に、検索エンジンが実装しているのはフィルタだ。ここまでは問題ない。今から複製コンテンツがどのような結果をもたらすのか、説明していこう。
検索エンジンのロボットがあるサイトを訪れるとき、そのセッションでクロールするページ数はあらかじめ決まっている。したがって、ロボットが複製コンテンツページ(これらは検索結果から除外されるだけ)をクロールすると、実質的に巡回できるページ数は無駄に減ってしまう。これはつまり、「問題のない」ページをクロールしてもらう機会が減るということだ。
複製コンテンツページへのリンクは、リンクジュースの無駄遣いだ。複製コンテンツページのPageRank値、すなわちリンクジュースは増えるかもしれないが、検索結果の順位が上がるわけではないので、リンクジュースが無駄になる。
最後に、検索結果にどのバージョンのページをランク入りさせるのか、その選び方に関する明確なアルゴリズムを公開している検索エンジンは存在しない。わかりやすく言うと、検索エンジンが同一コンテンツのページを3つ発見した場合、そのうちどのページを検索結果に表示し、どのページを除外するのだろうか? また、表示されるページは検索クエリごとに変化するのだろうか? つまるところ、検索エンジンがこちらの望み通りに振る舞ってくれることはないのだろう。
上記で述べた内容については、一部のSEO担当者から異論が出てくる部分があるかもしれないが、総論的にはほとんどのSEO担当者たちが賛同してくれると思う。それでは、このモデルを取り巻くいくつかの問題について話したいと思う。
一番の問題点
これは、複製コンテンツが何をもたらすのかを列記した上のリストの最後の項目で触れた問題だ。たとえば、自分のサイトに多数の製品ページがあるとしよう。そして各ページの印刷用バージョンも用意していたとする。検索エンジンは検索結果に表示するページとして、印刷用のページを選ぶ可能性がある。こういうことは実際にときどき発生しており、メインの製品ページよりも印刷用ページの持つリンクジュースが少なくて、検索順位が低いはずなのに起こることがある。
最近、わが社の顧客がこういうケースに遭遇した。こうした事態を修正するには、印刷用ページに対するリンクにnofollow属性を適用すると同時に、印刷用ページにはnoindexを記述しておくことだ。こうした処置を施した後、すべてが大幅に改善された。
このケースの場合、厳密に言うと実際にペナルティが課されたわけではない。しかし、検索順位が低いはずのページの方を検索結果に表示するのは、ある意味ペナルティのようなものだ。
自分のコンテンツを、サードパーティに共同配信した場合も、同じような事態が発生しかねない。この場合に生じる問題は、コンテンツの配信を受けているページの方が検索結果に現われ、配信元である自分のページが除外されてしまう可能性があるということだ。こうしたケースも実際に起こっている。僕が知る最善の対処法は、配信先のページにnoindexを指定してもらい、さらに、オリジナルのコンテンツページに対して、向こうからバックリンクを張ってもらうことだ。検索エンジンはほとんどの場合、この状況を適切に解釈し、自分のオリジナル版コンテンツを重視してくれる。
このケースについても、おそらくペナルティが課された訳ではないだろうが、そうは言っても、これは確かにペナルティのようなものだ。
実際にペナルティが課されたケース
上記の例については、実際のペナルティが課された結果ではない。しかし事実上、その影響はペナルティと変わらず、自分のページの検索順位が低くなる。ただし、実際にペナルティが発生し得るケースも存在する。
僕は、多数の情報源(数千ものサイト)からコンテンツを集約するサイトに取り組んでいた。そのサイト内にあるページの60%以上は、情報源としたサイトでも見ることのできるコンテンツを含んでいた。その集約サイトの価値は、コンテンツの分類および構成における独自性と、各情報源に関する付加価値情報にあった。
このサイトは長年にわたり、非常にうまく機能した。しかしその後、何もかもがうまく行かなくなった。トラフィックは、最盛期の20%以下にまで落ち込んだ。ページの大部分が補足インデックス(まだ見ることができた頃)行きとなり、うちのサイトからからコンテンツをコピーしているサイトのページよりも検索順位が低くなった。この事業は、根本から崩れてしまったんだ。
しかし、僕らはこのサイトを再建し、トラフィック量を元の水準の半分まで回復させることができた。僕らがやったことといえば、複製コンテンツの量を大幅に減らしただけだ。複製コンテンツの割合を低くしたことで、グーグルに毛嫌いされずに済む基準をクリアできたようだ。
まとめ
あるコンテンツについて、検索エンジンがどのバージョンを検索結果に表示するのか選ぶ方法が、その意図や目的はどうであれ、事実上のペナルティとなるケースは確かにある。僕が話をしたことのある検索エンジンの関係者たちは、それをペナルティとは呼ばないだろうが、サイト運営者にしてみれば、それはペナルティだ。こうした状況をどう呼ぶにせよ、自分のサイトに損害を与えるのだから、回避しなくてはならない。
さらに、複製コンテンツに対する本当のペナルティも存在する。こちらの状況に陥るには、かなり極端な条件が必要になるかもしれないが、ペナルティが課せられる可能性はあるし、実際にそれは起きることなんだ。
コメント
あらら
ついに、暴露しましたか。
Re: あらら
コメントありがとうございます。編集部の安田です。
情報は出してこそ意義がある! ですよね : )