このページは、外部サイト
SEO Japan の情報をRSSフィード経由で取得して表示しているため、記事の一部分しか表示されていなかったり、画像などが正しく表示されなかったり、オリジナル記事が意図したデザインと異なっていたりする場合があります。
完全な状態のオリジナル記事は 「
Googleのパンダアップデートに関わる質の決定階層」 からご覧ください。
SEO by the SeaからGoogleのパンダアップデートに関する独自の分析記事を。Googleが取得している特許を元に独自の推理を展開する辺り、どこまで当たっているかは分かりませんが中々に面白い内容になっています。 — SEO Japan 2010年5月上旬、多くのサイトのオーナー達がグーグルのランキングの変更に気づいた。その結果、多くのサイトがトラフィックを失っていた。5月1日に変更が実施されたため、このアップデートは多くの人々にメーデーアップデートと呼ばれた。 グーグルのウェブスパム部門を統括するマット・カッツ氏は、この変更に関する動画を配信し、グーグルはランキングでブランドを重要視するようになったのか?と言う疑問に対する答えの中で、このプロジェクトに取り組んでいる検索エンジニアの名を取って、このアップデートが「ヴィンスアップデート」と社内で呼ばれていることを明かした。 2月24日、グーグルの公式ブログにマット・カッツ氏とグーグルフェローのアミット・シンガル氏が、「結果でより質の高いサイトを見つける」と言うタイトルのエントリを投稿し、検索結果におけるウェブページのランキングの大きな変更について発表を行った。このエントリは、この変更により“グーグルのクエリの11.8%に著しく影響が及ぶ”と指摘していた。 この変更を行った理由は次のようなものであった: 「質の低いサイトのランキングを下げる – 質の低いサイトとは、ユーザーにとって価値が低いサイト、その他のウェブサイトからコンテンツをコピーしているサイト、そして、ただ単に役に立たないサイトを意味する。 同時に質の高いサイトのランキングを優遇する – 質の高いサイトとは、オリジナルのコンテンツを持ち、リサーチ、詳細なレポート、意義深い分析等の情報を含むサイトを意味する。 先月、ワイアードは、「ファームを嫌うパンダ: Q&A Googleのエンジニアのトップを直撃」と言うタイトルのマット・カッツ氏とアミット・シンガル氏へのインタビューを配信した。 このインタビューでは、両氏は、このアップデートが、質の高いサイトが、質の低いサイトよりも検索結果のランキングで上位に格付けされることを目指して行われたと述べている。 アップデートに関する記事を綴った人達の多くが、コンテンツファームのウェブサイトをターゲットにしているように見えるため、このアップデートを“ファーマーアップデート”と呼んでいたが、このインタビューでカッツ氏は、今回のアップデートに携わった重要なエンジニアの一人の名前を基に“ビッグパンダ”と呼ばれる社内のコードネームを明かした。 このアップデートには、以下のような質問の数を基にウェブサイトを分類する作業が含まれているようだ: このサイトは信頼できるか? 雑誌の一部であっても受け入れられるか? 広告が多過ぎるか? そこで、私はグーグルでパンダを検索してみた。 すると、Biswanath Panda氏の名前に遭遇した。 Biswanath Panda氏、そして、その他の数名のグーグラーが2009年に発表したホワイトペーパーは、広告システムでグーグルが実施している実験を取り上げていた。この実験は、広告のクリックに関連する直帰率を基に広告およびランディングページの質を広告システムが学ぶことが出来るかどうかを確かめるものであった。 このホワイトペーパーは、実験における広告の有効性にはさほど注目せず、学習システムが大量のデータに対応する能力に着目している。 これが当該のホワイトペーパーだ: 「PLANET: マップリデュースを使った階層の集合体の大幅な平行学習」(PDF)著: Biswanath Panda、Joshua S. Herbach、Sugato Basu、Roberto J. Bayardo このホワイトペーパーは元々第35回 ベリーラージベータベース国際会議紀要(VLDB-2009)で発表された。 結論では、著者は実験で有料検索の問題に注目しているものの、大規模な学習の問題に関わるその他の問題の解決に取り組む一方で、同じように有効な結果を達成することを期待していると綴っている。 ファーマー/パンダアップデートでは、大量のウェブサイトが、サイト内のページのコンテンツの質に基づいて分類されている可能性が高い。階層の集合体に関するホワイトペーパーで説明されているプロセスは、ランキングの変更の有力候補であり、ページの質を特定するために上述の質問の類への答えを基に検索結果の格付けを行うことが考えられる。 先月投稿した文書レベルの分類子とGoogleがスパムを特定する仕組みで、私はグーグルがウェブページをページの性質を基に分類する仕組みの例を紹介した。 私がエントリの中で取り上げた特許は、グーグルがウェブページで用いられている言語を特定する方法に関するヒントを与えてくれるが、私はグーグルがページに関する質問を投げかけて、ページがウェブスパムと考えられるかどうかを特定し、分類している点をこのエントリの要点に据えて説明した。 文書レベルの分類子のエントリの中で、私はグーグルが求めている可能性のあるアイテムに触れたが、ページで見つかった広告の数は位置、ページ上の新しいコンテンツまたは重複するコンテンツの数等を含む、その他のファクターが関わっている可能性はある。 Biswanath Pandaは、マット・カッツ氏がワイアードの記事で触れていた“パンダ”なのだろうか?グーグルは階層の集合体のホワイトページで綴られているようなアプローチを採用したのだろうか? それが大事なことだとは私には思えない。 本当に大事なのは、アップデートが、グーグルが質が高いと考えるサイトを結果で押し上げ、質の低いページを降格させる作業に専念していることだ。 このアップデートの教訓は、“検索結果のランキングがページの質をさらに重要視”している点がより明白になった点である。 グーグルはどのように“質”を決めているのだろうか? [...]