SEO向けリンク分析ツール、どれが優秀か比較してみた(前編)
SEOの観点で自サイトに張られているリンクを調査できるリンクデータ提供サービスには、MozのOpen Site Explorer、Majestic、Ahrefs、SEMrushなどさまざまあるが、どれが優れているのだろうか。規模? 深さ? 重複? 新しさ? この記事ではグーグルのデータとの相似性に着目して調べてみた。
増えつつあるリンクデータツールを使って、被リンクの情報を調べることに時間を費やしている読者は少なくないだろう。被リンクは現在でも、グーグルの検索順位決定アルゴリズムにおいて、最重要だとは言わないまでも、きわめて重要な要素の1つだ。
だが、われわれはツールが提供するリンクデータセットを額面通りに受け取ってしまう傾向がある。その理由の1つには、われわれにはこれしかないという事情があるのだが、検索順位がぱっとしない場合、どのツールの情報がベストなのかを知るもっとうまい方法はないものだろうか。具体的に言えば、次のようなことだ。
Moz、Majestic(日本語ページ)、Ahrefs(日本語ページ)、SEMrushといったさまざまなツールが提供するリンクインデックスデータの品質を評価するには、どうすればよいのだろう。
インデックスの品質に関するこのような疑問を解決するために、以前からよく使われているアプローチは次の4つだ。
規模 ―― 当該サービスによって報告されるルートドメイン名からのリンク数を調べる。参照元ドメイン名は検索順位と強い相関関係があるため、リンクのインデックスを評価するのに、検出されインデックス化されたドメイン名のユニーク数を基準とすることは理にかなっている。
深さ ―― また、ウェブがクロールされる深さを調べるのも有効だ。参照元ドメイン名の多様性よりも、インデックスに含まれるURLの総数にもっと目を向けるアプローチだ。
リンクの重複 ―― さらに高度なアプローチとして、インデックスに含まれるリンクのうち、グーグルのウェブマスターツール(WMT、Search Console)と共通しているリンクの数を数えるのもいい。
新しさ ―― 最後は、インデックスの新しさを調べることだ。インデックスに含まれるリンクのうち、まだ生きているリンクの割合を調べる。
こうしたテクニックを利用した調査結果は(新しいものも古いものも含めて)上質なものが数多くある。チャンスがあれば調べてみるとよいだろう。
- BuiltVisibleによるMoz、Majestic、GWT、Ahrefs、Search Metricsの分析
- SEOBookによるMoz、Majestic、Ahrefs、Ayimaの比較調査
- Matthew WoodwardによるAhrefs、Majestic、Moz、Raven、SEO Spyglassの調査
- Marketing SignalsによるMoz、Majestic、Ahrefs、GWTの調査
- RankAboveによるMoz、Majestic、Ahrefs、LinkResearchToolsの比較調査
- Stone Temple ConsultingによるMozとMajesticの調査
これらの調査はすべて、上記の手法をとてもうまく活用している。しかし、どの調査にも同じ1つの限界が存在する。それは、リンクインデックスの価値を判断するために必要な最も重要な指標の1つ、つまり、グーグルのリンクグラフと比較してどの程度の相似性があるのか示されていないことだ。
そこで、われわれAngular Marketingでは、この点を詳しく見ていくことにした。
Google Search Consoleのデータとの相似性
さて、相似性を明らかにすることがなぜ重要なのだろうか。
われわれが使用する最も重要で価値のある指標の多くは、相対的モデルに基づいている。PageRank、MozRank、CitationFlow、Ahrefs Rankのデータは本質的に相対的なものだ。データセット内のある1つのURLのスコアは、そのデータセットの他のURLと比較した相対的な評価だ。
ということは、データセットに偏りがあれば、結果も偏ったものになる。
視覚化
リンクグラフは、クロールの優先順位によって偏りが出る。インターネット全体をあますことなく完全にクロールしてインデックスすることは現実的ではないため、すべてのリンクグラフは、ウェブの偏ったサンプル(一部分)なのだ。これは、グーグルのリンクグラフといえども同じだ。
下の画像がウェブを表したものだと想像してみてほしい。1つひとつの点は、インターネットの1つのページを表しており、その中で、グーグルがインデックス化した部分を緑色で囲んである。
当然のことだが、ウェブをクロールしているのはグーグルだけではない。他にもMoz、Majestic、Ahrefs、SEMrushなどの企業が、それぞれ独自にクロールの優先順位付けを行い、異なるリンクインデックスを作成している。
上の例では、グーグルとは別のリンクデータ提供元がウェブをインデックス化しようとしている状況を表している。
リンクデータ提供元1(紫色)は、グーグルと相似なモデルを構築することに成功しており、規模は大きくないが、相似性は高い。
リンクデータ提供元2(青色)は、インデックスの規模がはるかに大きく、リンクデータ提供元1と比べてグーグルと共通するリンクの数も多いように見えるが、相似性はほとんど見られない。
では、こういう相似性をどのように測定すればいいだろうか。そして、グーグルとの相似性が最も高いのはどのデータセットなのだろうか。
手法
最初の手順は、分析のための関連性の指標を決めることだ。
グーグルは自社のリンクグラフについてあまり情報を提供していない。われわれの手元にあるのは、Google Search Consoleのデータだけだ。
そこで、われわれが使用できる最適なソースは、参照元ドメインの数になる。特に知りたいのは、参照元ドメインリンク対とわれわれが呼ぶものだ。
参照元ドメインリンク対とは、「ask.com->mlb.com: 9,444」のように表される。これは、ask.comからmlb.comのリンクの出現回数が9444という意味だ。
手順
Google Search Consoleに登録されている100を超えるサイトについて、参照元ドメインリンク対と値を決定する
Ahrefs、Moz、Majestic、Fresh、Majestic Historic、SEMrushで同様の作業を行う
各データセットの参照元ドメインリンク対をグーグルと比較する(ポアソン分布に従うと仮定)
データセットのパフォーマンスをシミュレーションする(Moz対Majestic、Ahrefs対SEMrush、Moz対SEMrushなど)
データセットのパフォーマンスの比較シミュレーションを実行する(Moz対Majestic、Ahrefs対SEMrush、Moz対SEMrushなど)
その結果を分析する
結果
1対1で比較した分析の結果を見ると、一見して勝者は明らかなようだ。1対1分析では、MozがAhrefsを僅差で上回っているものの、グラフ全体から見ればMozとAhrefsはほぼ互角だ。Moz、Ahrefs、そしてSEMrushは、Majestic FreshやMajestic Historicよりずっと優れているように見える。
これは本当なのだろうか。またその理由は何だろうか。
調べてみると、インデックスの大きさと相似性が反比例の関係にあることがわかった。これは一見不思議な話で、インデックスが大きい方がグーグルとの相似性が高くなるはずではないかと思われるかもしれない。だが、必ずしもそうではないのだ。
この記事は、前後編の2回に分けてお届けする。後編となる次回は、なぜこういう不思議な結果になるのか、その意味を考察していく。→後編を読む
ソーシャルもやってます!