Moz - SEOとインバウンドマーケティングの実践情報

検索エンジン視点のWebやリンクの統計データを紹介しよう(後編+SEO的分析)

どんな要因が順位に影響を与えているのか、そして、イマドキのSEOのTIPS。

今記事は前後編の2回に分けてお届けしている。Linkscapeのインデックスから得られたさまざまな統計についてお伝えした前回に続き、今回は、Linkscape独自の指標について説明し、さまざまな指標と検索順位との相関関係について考察してみよう。

検索エンジンとLinkscapeの測定指標

検索エンジンと同様に、僕らはインデックス内のページやサブドメイン、ルートドメインについて、さまざまな指標を計算して、スパムを発見したり、人気や信頼性の順に並べたりしている。以下に、現在採用している指標「mozRank」「Domain mozRank」「mozTrust」の度数分布のグラフをいくつか示そう。

mozRankの度数分布

mozRankは生のリンク人気を計算したものだ。グーグルのPageRankやヤフーのWebRank、MSN/LiveのStaticRankと同じく、リンクを支持票として捉え、人気の高いページからのリンクほど重要なものとして扱う再帰的アルゴリズムだ。これはクロールやインデックス化の対象とすべきページを判断するのには便利なんだけど、実際の重要度を測る尺度としては不十分で、かなりノイズが多い。

Domain mozRankの度数分布

Domain mozRankは、ページレベルのmozRankと同じやり方で計算されるが、基になるのはドメインレベルのリンクグラフだ。だから、1つのルートドメインから別のルートドメインに張った一意のリンクしか計算に入れず、あるサイトから別サイトに張ったリンクが1件でも、100件でも、1000件でも関係ない。この指標は、ルートドメインの人気や重要度を判定するのに特に優れている。サブドメインのリンクグラフでは、不正操作やスパムに引っかかりやすい。

ドメインレベルのmozTrustの度数分布

mozTrustは、ドメインレベルとページレベル両方のリンクグラフについて計算するものだが、スパム識別に非常に効果がある(mozRankと組み合わせると特に——2つの指標の差が不正リンクに対する優れた判断材料となる)。mozTrustはヤフーのTrustRankと同じ考え方によるもので、信頼できるシードURL/ドメインからからリンクジュースを受け渡す再帰的アルゴリズムを実行している。

相関の測定

僕が発表したデータの中で、SEOへの応用という観点から最も興味深かったのは、おそらくそれぞれの指標と検索順位との相関について調べたデータだろう。

うちの開発担当者ベン・ヘンドリクソンは、以下のような質問に答えようとして、データの収集と分析をバリバリやってくれている。

個々の指標からは、検索順位の向上をどの程度予測できるのか?

ベンが初期段階で出した分析結果は、示唆に富んだ内容だった。

グーグルの検索結果順位n+1と各指標との相関

ベンが作成した、検索順位が1ランク上がることと相関している指標(要するに、検索結果の1位と2位や、5位と6位の違いは何か)を調べたこのグラフからは、どの指標も単独では順位の予測に格別優れているわけではないってことがわかる。

しかし、注目すべきところがあるとすれば、URLにリンクを張っているルートドメインの数と、そのURLのmozRankが、どちらも95%信頼区間を少し超えている点だろう。SEO指標として昔から使われてきたヤフーのリンク数やAlexaの計測値(これらはツールバーやSEOレポートの多くに使われている)なんかは、ほとんど何の役にも立っていない。

グーグルの検索結果順位n+10と指標の相関

次に、検索順位が10ランク上がることと相関している指標はどれか(要するに、検索結果の1ページ目と2ページ目、2ページ目と3ページ目の違いは何か)を調べたところ、(まだすばらしいと言えるところまではいかないが)はるかに良好な結果が得られた。ベンの示すところでは、95%信頼区間を超える指標は1つだけ(URLにリンクを張っているドメイン数)だが、ランダム予測を20%以上上回った指標はいくつかあった。

(少なくとも僕にとって)最も驚くべき結果は、グーグルで調べたリンク数が実際に検索結果順位と相関していたことで、これはまったく無作為にリンク数をカウントしているというわけではないことを示唆している(標本数が少ないことを考えると、どうしてもそんなふうに思えてしまうけど)。

全指標の中で、リンクを張っているルートドメイン数が最も高い相関を示したことは驚きではない(うちでもドメイン上位500リストを作るのに使っている)。これは最も不正操作が難しい指標の1つで、しかも信用度、重要度および検索順位と高い相関がある。

SEOに役立つヒント

クロールやインデックス作成において僕らが行っていることや、僕らがこれまでに遭遇した問題(そして検索エンジンが同様の問題に遭遇しているのを目にした経験)を基に、ちょっとしたヒント集を作ってみた。中には言うまでもないもの、よく知られているものもあるけど、どれも重要な推奨事項として覚えておくだけの価値はあるし、検索エンジンもきっと推奨するはずのものばかりだ。

  1. 検索エンジンがちゃんと正規化の処理をしてくれるなんてことを当てにしない。

  2. 多種多様なルートドメインからのリンク獲得に努める。必ずしもPageRankが高いサイトや、リンク数の多いサイトでなくてもいい。

  3. スマートで使いやすく、短いURLを使うこと。その方がずっと処理しやすいし、検索エンジンがインデックスに入れておきたいと思うような、有用で独自性の高いコンテンツとの間にもずっと高い相関がある。

  4. リンクをたくさん稼ぎたいなら、ユーザーが自分のサイトやページに埋め込めるウィジェット/バッジ/リンクなどの分散型コンテンツを作るのが非常に有効だ。ルートドメインからのリンク獲得数で上位を占めるページの多くは、この手法でその地位を手に入れている。

  5. 高い検索順位をとれるかどうかを正確に判断したいなら、ツールバーページランクや生のリンク数に頼ってはいけない。僕らのデータを見る限り、優れた判断材料でもないし、順位と高い相関のある指標でもない。

  6. ソーシャルウェブが伸びてきている。これを上手に取り入れている人たちもだ(これも、さっきのドメイン上位500リストを見ればわかる)。

  7. nofollowをサイト内リンクに使うことをためらわなくていい。ウェブでは決して珍しいことではない。ただし、使い方には注意すること——使い方を間違えると、深刻なダメージをこうむるおそれがある。

  8. コンテンツはできる限り1つのサブドメインおよびルートドメイン上で運用する。そのドメインに関連する各指標は、コンテンツの知名度を上げ、高い検索順位にふさわしい価値のあるものにする上で大いに役立つ。

  9. 「馴染みのない」技術やリンク獲得戦略を使わない。他と変わった技術を使うと、クロールや処理、インデックス化がしにくくなるし、おかしなリンク獲得戦略はスパムや不正操作とみなされるおそれがある。

今回のデータ、楽しんでもらえただろうか(どうぞ遠慮なくほかの人と共有してほしい)。それと、更新されたLinkscapeのインデックスもぜひ使ってみてほしい。

あと、ベンとニックには僕からお祝いと感謝の言葉を贈るよ。2人ともLinkscapeですばらしい仕事をやってくれた。何か質問があればコメントしてほしい。2人が答えやヒントをくれるだろう。

用語集
PageRank / SEO / WWW / nofollow / インデックス / クロール / ドメイン名 / ページランク / リンク / 検索エンジン
この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

CX
「CX」(Customer Experience)は、「顧客の体験の心地よさ」に ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]