Moz - SEOとインバウンドマーケティングの実践情報

SEO向けリンク分析ツール、どれが優秀か比較してみた(前編)

この記事ではグーグルのデータとの相似性に着目して調べてみた

SEOの観点で自サイトに張られているリンクを調査できるリンクデータ提供サービスには、MozのOpen Site Explorer、Majestic、Ahrefs、SEMrushなどさまざまあるが、どれが優れているのだろうか。規模? 深さ? 重複? 新しさ? この記事ではグーグルのデータとの相似性に着目して調べてみた。

この記事の内容はすべて筆者自身の見解であり(ありそうもないことだが、筆者が催眠状態にある場合を除く)、Mozの見解を反映しているとは限らない。

増えつつあるリンクデータツールを使って、被リンクの情報を調べることに時間を費やしている読者は少なくないだろう。被リンクは現在でも、グーグルの検索順位決定アルゴリズムにおいて、最重要だとは言わないまでも、きわめて重要な要素の1つだ。

だが、われわれはツールが提供するリンクデータセットを額面通りに受け取ってしまう傾向がある。その理由の1つには、われわれにはこれしかないという事情があるのだが、検索順位がぱっとしない場合、どのツールの情報がベストなのかを知るもっとうまい方法はないものだろうか。具体的に言えば、次のようなことだ。

MozMajestic日本語ページ)、Ahrefs日本語ページ)、SEMrushといったさまざまなツールが提供するリンクインデックスデータの品質を評価するには、どうすればよいのだろう。

インデックスの品質に関するこのような疑問を解決するために、以前からよく使われているアプローチは次の4つだ。

  • 規模 ―― 当該サービスによって報告されるルートドメイン名からのリンク数を調べる。参照元ドメイン名は検索順位と強い相関関係があるため、リンクのインデックスを評価するのに、検出されインデックス化されたドメイン名のユニーク数を基準とすることは理にかなっている。

  • 深さ ―― また、ウェブがクロールされる深さを調べるのも有効だ。参照元ドメイン名の多様性よりも、インデックスに含まれるURLの総数にもっと目を向けるアプローチだ。

  • リンクの重複 ―― さらに高度なアプローチとして、インデックスに含まれるリンクのうち、グーグルのウェブマスターツール(WMT、Search Console)と共通しているリンクの数を数えるのもいい。

  • 新しさ ―― 最後は、インデックスの新しさを調べることだ。インデックスに含まれるリンクのうち、まだ生きているリンクの割合を調べる。

こうしたテクニックを利用した調査結果は(新しいものも古いものも含めて)上質なものが数多くある。チャンスがあれば調べてみるとよいだろう。

これらの調査はすべて、上記の手法をとてもうまく活用している。しかし、どの調査にも同じ1つの限界が存在する。それは、リンクインデックスの価値を判断するために必要な最も重要な指標の1つ、つまり、グーグルのリンクグラフと比較してどの程度の相似性があるのか示されていないことだ。

そこで、われわれAngular Marketingでは、この点を詳しく見ていくことにした。

Google Search Consoleのデータとの相似性

さて、相似性を明らかにすることがなぜ重要なのだろうか。

われわれが使用する最も重要で価値のある指標の多くは、相対的モデルに基づいている。PageRank、MozRank、CitationFlow、Ahrefs Rankのデータは本質的に相対的なものだ。データセット内のある1つのURLのスコアは、そのデータセットの他のURLと比較した相対的な評価だ。

ということは、データセットに偏りがあれば、結果も偏ったものになる。

視覚化

リンクグラフは、クロールの優先順位によって偏りが出る。インターネット全体をあますことなく完全にクロールしてインデックスすることは現実的ではないため、すべてのリンクグラフは、ウェブの偏ったサンプル(一部分)なのだ。これは、グーグルのリンクグラフといえども同じだ。

下の画像がウェブを表したものだと想像してみてほしい。1つひとつの点は、インターネットの1つのページを表しており、その中で、グーグルがインデックス化した部分を緑色で囲んである。

点はインターネット上のページで、緑色で囲まれたドットはグーグルがインデックス化したページだと考えてほしい。グーグルはインターネット上にある多くのページをインデックス化しているが、すべてのページをインデック化しているわけではない。

当然のことだが、ウェブをクロールしているのはグーグルだけではない。他にもMozMajesticAhrefsSEMrushなどの企業が、それぞれ独自にクロールの優先順位付けを行い、異なるリンクインデックスを作成している。

リンクデータ提供元1 リンクデータ提供元2
複数のリンクデータ提供元が、グーグルと同じようにウェブのリンクグラフの理解に役立つサービスを提供し、独自にウェブのインデックス化を始めたとしよう。

上の例では、グーグルとは別のリンクデータ提供元がウェブをインデックス化しようとしている状況を表している。

リンクデータ提供元1(紫色)は、グーグルと相似なモデルを構築することに成功しており、規模は大きくないが、相似性は高い。

リンクデータ提供元2(青色)は、インデックスの規模がはるかに大きく、リンクデータ提供元1と比べてグーグルと共通するリンクの数も多いように見えるが、相似性はほとんど見られない。

では、こういう相似性をどのように測定すればいいだろうか。そして、グーグルとの相似性が最も高いのはどのデータセットなのだろうか。

手法

最初の手順は、分析のための関連性の指標を決めることだ。

グーグルは自社のリンクグラフについてあまり情報を提供していない。われわれの手元にあるのは、Google Search Consoleのデータだけだ。

そこで、われわれが使用できる最適なソースは、参照元ドメインの数になる。特に知りたいのは、参照元ドメインリンク対とわれわれが呼ぶものだ。

参照元ドメインリンク対とは、「ask.com->mlb.com: 9,444」のように表される。これは、ask.comからmlb.comのリンクの出現回数が9444という意味だ。

手順

  1. Google Search Consoleに登録されている100を超えるサイトについて、参照元ドメインリンク対と値を決定する

  2. Ahrefs、Moz、Majestic、Fresh、Majestic Historic、SEMrushで同様の作業を行う

  3. 各データセットの参照元ドメインリンク対をグーグルと比較する(ポアソン分布に従うと仮定)

  4. データセットのパフォーマンスをシミュレーションする(Moz対Majestic、Ahrefs対SEMrush、Moz対SEMrushなど)

  5. データセットのパフォーマンスの比較シミュレーションを実行する(Moz対Majestic、Ahrefs対SEMrush、Moz対SEMrushなど)

  6. その結果を分析する

結果

1対1で比較した分析の結果を見ると、一見して勝者は明らかなようだ。1対1分析では、MozがAhrefsを僅差で上回っているものの、グラフ全体から見ればMozとAhrefsはほぼ互角だ。Moz、Ahrefs、そしてSEMrushは、Majestic FreshやMajestic Historicよりずっと優れているように見える。

これは本当なのだろうか。またその理由は何だろうか。

グーグルデータとの相似性の1対1での比較 見た目ではだまされる可能性がある。Majesticは本当にこれほど悪いのだろうか。また、Moz、SEMrush、AHrefsは本当にこれほど良いのだろうか。
データセットがグーグルのリンクデータに近い結果を予測できる可能性を、1対1で比較した。

調べてみると、インデックスの大きさと相似性が反比例の関係にあることがわかった。これは一見不思議な話で、インデックスが大きい方がグーグルとの相似性が高くなるはずではないかと思われるかもしれない。だが、必ずしもそうではないのだ。

データが大きい = 問題が大きい
グーグルデータとの相似性の1対1での比較
インデックスの規模
インデックスの規模と、グーグルのドメイン名リンク数の予測値は、反比例している。グーグルのクロールの優先順位付けを真似できているところは1つもないようだ。
このグラフからわかるように、1対1の比較のスコアが高いほどデータセットは小さく、インデックスの規模は予測レベルと反比例しているように思われる。

この記事は、前後編の2回に分けてお届けする。後編となる次回は、なぜこういう不思議な結果になるのか、その意味を考察していく。→後編を読む

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

今日の用語

QDF
QDFは、どんな検索キーワードに対してどんな検索結果を返すかを決定する際にグーグ ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]