グーグル検索結果のどこをクリックした訪問か分析できる“ved”パラメータの秘密(基本編)
今回のテーマは、グーグルの検索結果(ユニバーサル検索)のどこからトラフィックが流入しているかを読み解くための、リファラ文字列の理解だ。
オーガニック検索の何位に表示された検索結果からのアクセスなのか、検索結果にワンボックスで表示された画像や動画からのアクセスなのかなど、アクセス解析ツールをうまく使うことで、詳細に分析し、SEOに役立てられる可能性のあるデータが、サイトへのアクセスのリファラ文字列に隠されているのだ。
分析の仕方によっては、「(not provided)」で隠された検索キーワードを高い精度で推測できる場合もある、この「ved」パラメータの秘密に迫っていく。
ステップごとに説明し、最終的にはGoogleアナリティクスでこのデータを分析できるようにする具体例を示していく。が、その前に、この記事を書くに至った、僕らが抱えていた問題を紹介しておきたい。
検索ユーザーが「なぜ」「どう」来たのかを理解したいのに!
2011年、SEOmozのマシュー・ブラウンと僕は、テクニカルSEOとオーディエンス開発の面でニュースパブリッシャを支援する代理店を立ち上げた。別の仕事にも携わっていた僕ら(当時ニューヨークタイムズ紙にいたマシューは特に)は、ユニバーサル検索のリファラに関するデータの欠如を埋め合わせるのに苦戦していた。というのも、僕らが使っていたウェブ分析のプラットフォームでは、ウェブ検索からの訪問でも、ワンボックス検索で表示されるニュース検索結果のリンクや画像検索結果からの訪問でも、すべて「オーガニック検索のトラフィック」として扱われていたからだ。
その後グーグルのSSL検索が始まった。
それによって、リファラデータはより一層わかりにくくなってしまった。そのアクセスがユニバーサル検索のどの部分から来たかがわからないだけでなく、約10%ではトラフィックをもたらしたキーワードさえわからなくなったんだ。
ユーザーが「何を求めて」「どのように」検索エンジンからやってくるのかわからなければ、SEOのためのコンテンツ戦略をどうやって考えればいいんだ?
これが、僕たちみんなの心の中に常にあった疑問だった。悲しいかな、SSL検索はどんどん広まり、今ではグーグルからのトラフィック全体のうちでかなり大きな割合を占めている。参考までに、SEOmozにきたトラフィックのうちキーワードが「(not provided)」となっているものの最新の割合は次のようになっている。
その答はリファラの「ved」パラメータにあった!
マシューと僕は、この失われたデータの「一部」を取り戻す唯一の方法は、ほかのソースに目を転じることだと理解していた。
幸い、マシューはスペイン語が(ある程度)わかるから、このブログを見つけてくれた。ブログの筆者は、グーグルのリファラ文字列内にある「ved」というパラメータに、その検索結果がどういう種類のものだったかを特定する秘密があると指摘していた。
ちょっと検索をして結果に出る「href属性」の値を見てみたところ、この指摘に一理あることがわかった。僕らはすぐにGoogleアナリティクスのプロフィールフィルタを設定し、グーグル経由で1日あたり3万件の検索リファラを受け取るクライアントについてこのパラメータを抽出することにした。
数時間後、僕らの手元には、この筆者の理論のいくつかを立証し、僕らが独自の理論を導き出すのに十分な量のデータが得られた。
ここからは、僕らが発見したことを紹介しながら、Googleアナリティクスのフィルタの設定方法をステップごとに説明し、データの使い方の具体例も示していく。
Googleからのリファラ文字列って、そもそも何?
まず、このパラメータがどこにあるかを説明しよう。
簡単に言うと、グーグルのリファラ文字列とは、検索結果ページ内の各項目をクリックしたときにまずジャンプするURLだ。クリックできるリンクのhref属性に指定されている値だというほうがわかりやすいだろうか。
「検索結果からのリンク先はその項目のURLでは?」と思うかもしれない。最終的にはそうなるのだが、実際には少し違う。検索ユーザーがグーグルの検索結果ページにあるリンクをどれかクリックすると、まずグーグルのURLを経由してから、リダイレクトされて最終目的地に到達するんだ。
グーグルがこういう風にしている理由として最も可能性が高いのは、内部でのデータ収集だ。グーグルにしてみれば、僕らのような外部の人間はトラフィックがどこから来ているかを知るべきではないが、自分たちが活用するのは当然だ。おそらく、検索結果(SERP)に関連するデータを収集するためにね。
「ved」パラメータを見れば、検索結果ページのどの部分をクリックしたかがわかる
ここで取り上げたいパラメータは、「cd」と「ved」の2つだ。
「cd」パラメータは、1組の検索結果内における順位を示している(以前にも取り上げた記事がある)。
「ved」パラメータは、僕の知る限り3つの部分に分かれていて、次の情報がわかる。
- その結果がユニバーサル検索のどの部分にあるか
- 垂直検索内における順位(相対順位)
- 検索結果内のける順位(絶対順位)
この記事では、まずユニバーサル検索の要素に着目して解説していく(相対順位と絶対順位に関しては別の機会に)。
実例をいくつか見てみよう。
「ved」パラメータの中に「QFj」がある場合、その結果が通常のウェブ検索の結果であることを示している。たとえばこんな感じだ。
SEOmozウェブセミナーのある参加者が、ウェブ検索における「ved」パラメータの特殊な変数について、鋭い観察をしてくれた。
「QqQIw」(Iは大文字のiでLの小文字ではない)は、ユニバーサル検索の結果で、ワンボックス検索のニュース検索結果に含まれていることを示している。QpwIがあると、その結果がニュース検索結果のサムネイル画像だったことを意味する。
考え方はわかっただろう。vedに出てくるほかの値も下に紹介しておく。ほかにももっとあるような気がするし、このコミュニティのみんなが何を見つけて共有してくれるかに、僕は期待している。
コード | 検索の種類(検索結果のどの部分のリンクか) |
---|---|
QF | オーガニック検索 |
QqQIw | ワンボックス検索 : ニュース検索結果(リンク) |
QpwI | ワンボックス検索 : ニュース検索結果(サムネイル) |
Q9QEw | ワンボックス検索 : 画像検索結果 |
Qtwlw | ワンボックス検索 : 動画検索結果(リンク) |
QuAIw | ワンボックス検索 : 動画検索結果(サムネイル) |
QjB | オーガニック検索のサイトリンク |
BEPwd | ナレッジグラフの画像 : リード部分 |
BEP4d | ナレッジグラフの画像 : リード部分ではない |
この記事は、前後編の2回に分けてお届けする。後編となる次回は、「ved」パラメータの分析に必要なGoogleアナリティクスのフィルタ設定と、このパラメータのユースケースについて見ていく。
ソーシャルもやってます!