Moz - SEOとインバウンドマーケティングの実践情報

パンダアップデートとは? パンダでグーグルが評価する20以上の項目(前編)

パンダとは何か、検索の品質やコンテンツの品質という観点からどのような点が評価されているか
この記事はもともとMozのYOUmozセクションに掲載したものですが、われわれのコミュニティにとって非常に興味深く、大きな価値をもたらしてくれるのでこちらのブログに格上げしました。筆者の意見は筆者独自のものであり、Mozの考え方を示すものではありません

この記事では、パンダアップデート4.0で何が起こったのかを、パンダアルゴリズムとは何か、検索の品質やコンテンツの品質という観点からどのような点が評価されているかをおさらいしたうえで、それらの項目がどのように影響したのかを、パンダ4.0が強く影響を与えたというプレスリリースサイトを例に検証する。

僕たち検索業界人の多くは、「パンダ4.0」のリリースに面食らった。パンダは基本、月に何回かの頻度でアルゴリズムに「組み込まれていくもの」というのが一般常識になっていたから、アップデートの発表は驚きだった。

それは、Payday LoanアルゴリズムのアップデートeBayが手動ペナルティを科せられた可能性といったような発表と同じタイミングだったため、インパクトが減じられた感こそあったものの、パンダ4.0へのアップデートによる犠牲者は、プレスリリースサイトの大手などに目立った

Search Engine Land」と「Seer Interactive」はそれぞれ、パンダ4.0へのアップデート後に主立ったプレスリリースサイトで大幅なトラフィックの減少があったことを確認している。

「グーグルが同時に何件もの手作業を実施した」とか「これらのサイトがペイデイローンアルゴリズムのアップデートに影響された」とか、そうした原因がなかったとは断言できないが、それでもこうしたトラフィックの激減に対する最も納得できる説明として、パンダアップデートがあることは推論できる。

では、いったい何が起こったのか? ブレスリリースサイトを狙いすましたように見える理由を解明できるだろうか? これらのサイトが特にパンダアルゴリズムの影響を受けやすいのはなぜか?

こういった質問に答えるためにはまず、「パンダアルゴリズムとは何か?」という根本的な疑問に答える必要がある。

パンダアルゴリズムとは? ―― 概説

パンダアルゴリズムはグーグルにとって、検索の品質に関わる特定の問題に対処するうえで、方法論の画期的転換だった。グーグルは、コンテンツの品質を判断するために、特許を取得した機械学習技術を活用しながら、本物の人間を評価担当者として、ウェブサイトのサンプルセットの質を判断するようにした。僕たちはこのサンプルを「トレーニングセット」と呼んでいる。評価担当者たちへの質問は次のようなものだった。

Webサイトの質を評価担当者が判断する際の質問項目
  1. その記事にある情報を信用できるか?

  2. その記事は、テーマについての専門家、もしくはテーマをよく知る熱意ある人物によって書かれたものか、あるいは質的に浅薄な記事か?

  3. 同一あるいは類似のトピックを、キーワードを微妙に変えただけの複製記事や重複した記事、あるいは不必要な記事がそのサイトにないか?

  4. クレジットカード情報を安心して提供できるサイトか?

  5. 記事内に綴りや文体、事実に関する誤りはないか?

  6. 話題は、サイト読者の純粋な関心に沿って提供されているか? それとも、検索エンジンで上位にランキングされそうなものを推測してコンテンツを作っているのか?

  7. その記事は、独創的なコンテンツや情報、独自のレポートや調査、分析を提供しているか?

  8. そのページは、検索結果に表示される他のページと比較して、十分な価値を提供しているか?

  9. コンテンツの品質管理はどの程度行われているか?

  10. その記事は、ストーリーを一面的な視点から書いていないか?

  11. そのサイトは、その話題に関するオーソリティとして認識されているか?

  12. コンテンツは、多くのクリエイターによって大量生産や委託生産されたものであったり、大規模なサイトネットワークを通じて広められたりしたものではないか? その結果、個々のページやサイトに十分な注意が行き届いていないようなことはないか?

  13. 記事はきちんと編集・校正されているか? それとも、ずさんで急ごしらえのように感じられるか?

  14. 健康関連の検索において、そのサイトにある情報を信頼できるか?

  15. このサイトの名称を聞いたときに、権威ある情報源として認識するか?

  16. この記事は、テーマについて遺漏のない、あるいは広範な説明をしているか?

  17. この記事には、明らかな事実だけではなく、洞察に富んだ分析や興味を引く情報が含まれているか?

  18. ブックマークしたり、友人と共有したり、人に薦めたりしたくなるようなページか?

  19. 記事の中に過度に広告が含まれていて、メインのコンテンツを読むことを妨げたり、注意をそらせたりするようことはないか?

  20. 雑誌や事典、書籍として出版されることを期待したくなる記事か?

  21. 記事が短くて内容が希薄だとか、参考になるような具体性がないということはないか?

  22. ページの細部にまでくまなく注意を払って作られているか、あるいは細部にはさほど注意が払われていないか?

  23. このサイトの各ページを見て、ユーザーが不満に思うことはないか?

これらの質問への答えを実際のユーザーから得ると、グーグルは、このような答えが予測できるであろう変数をリストアップし、機械学習のテクニックを使ってこうした質問で評価が低いと予想されるモデルを作り上げた。

たとえば、サイトのhttpsバージョンがあれば、「クレジットカード情報を安心して提供できるか」という質問に対して、高い評価が予想できるかもしれない。それから、このモデルをインデックス全体に適用して、質問票で評価が低いと思われるサイトをフィルタリングしていく。

このフィルタリングが、「パンダアルゴリズム」として知られるものになったわけだ。

こうした質問で、サイトはどう評価されるのか? プレスリリースサイトを例に検証

まずMozには、君がサイト上でパンダアルゴリズムによる評価を実行してみるための素晴らしいチュートリアルがある。これは、パンダに対してだけでなく、あらゆる種類のユーザー調査で役に立つ。

ただし、この記事で僕が分析に使用したグラフとデータは「PandaRisk.com」のものだ。

実をいうと、PandaRiskの所有者は、僕が勤務しているViranteだ。グラフはすべて、各プレスリリースサイト上のいくつかのページからの結果を平均化して作ったものであり、それぞれのプレスリリースサイトのページサンプルとなっている。

さて、詳しく見ていくことにしよう。話を簡潔に進めるために、質問票の中から中核となる4つの問いだけに焦点を当て、1つずつ説明したい。

この記事でチェックしたのは、次の4つの項目だ

  • サイトには、洞察に富んだ分析が含まれているか?
  • 信頼してクレジットカードを使えるサイトか?
  • オーソリティであると見なせるサイトか?
  • ブックマークしたり共有したりしたいと思うサイトか?

この記事は、前後編の2回に分けてお届けする。前編は少し短くまとまってしまったが、後編となる次回は、ページの品質に関してさまざまなサイトが抱える問題点とそれぞれの解決策を、プレスリリースサイトを例に具体的に紹介する。あなたの管理しているサイトがプレスリリースサイトでなくても、後編の内容は参考になるはずだ。→後編を読む

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

アップロード
手元のPCなどの機器から、ネットワークを介して、別のPCやファイルサーバー、ウェ ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]