GAで“どこから来たか”を知る「参照元」とは|流入経路を正しく計測![第24回]
アクセス解析でいう「参照元」とは、一般的にひとことで言えばユーザーがどのWebページから訪問してきたのかを表すものだ。「アクセス元」や「リファラー」などと呼ばれることもある。
しかし、Googleアナリティクスの「参照元」の定義は少々特別な仕様で、他のアクセス解析ツールとはかなり異なる部分がある。しかも、そのことを理解している人は多くないように感じる。
今回と次回の2回を使ってGoogleアナリティクスの「参照元」について解説していく。まずは一般的なアクセス解析で使われている「参照元」とは何かを中心に話をしよう。そして次回、Googleアナリティクスの「参照元」がどのように特殊なのかについて詳しく説明していく。
- 一般的に使われている「参照元」がわかる
- 「参照元なし」の内訳を知る
一般的な意味での「参照元」とは?
まずアクセス解析で一般的な意味での「参照元」の定義を説明しておこう。ここに「ページA」と「ページB」という2つのページがあるとする。2つのページは別のWebサイトで、URLはそれぞれ次のとおりだとしよう。
ページAには、ページBへのハイパーリンクが記述されている。たとえば次のようなa要素(アンカータグ)で記述されたハイパーリンクだ。
あるユーザーがページAをブラウザで開き、そこに表示されたハイパーリンクをクリックしてページBに移動したとしよう。その際、ページBの閲覧情報の中に「ページAから来た」という情報が生成される(ブラウザ上では表示されないが情報として持っていてページBのサーバーにも伝えられる)。この情報をアクセス解析ツールが取得してページBの「参照元」とするのだ。
同様に、同じサイト内のあるページから別のページへリンクをクリックして移動する場合にも、それぞれのページへのアクセスには参照元が記録される。このような計測サイト内ページからサイト内ページへの移動に伴う参照元のことを、「内部参照元」とでも呼んでおこう。
これに対して、外部サイトから計測対象サイト内に入ってきた場合の参照元のことを「外部参照元」と呼ぶことにする。
1つの訪問(セッション)に1つの参照元となっていることが多い
ただし、Googleアナリティクスを含む多くのアクセス解析ツールで「参照元」という場合には「外部参照元」だけを意味し、「内部参照元」は含まれないのが普通だ。つまり訪問時(各セッション)のランディングページ(閲覧開始ページ)の「外部参照元」を意味することが多い。
たとえば図2のオレンジ枠部分が計測対象サイト内にあるページだとしよう。
ハイパーリンクを連続でクリックしてページを閲覧した場合、厳密には次のようになる。
しかし多くのアクセス解析ツールでは、「サイトbへの一連の訪問の外部参照元」つまり計測対象サイトb内のランディングページであるページBの「参照元」であるページA(サイトa内)のことを「参照元」とするのが一般的だ。
言い換えれば、本来はページへのアクセスごとに1つずつ参照元がある場合でも、多くのツールでは1つの「セッション(訪問)」に対して、1つの(外部)「参照元」を割り当てるのが一般的ということになる。
「参照元なし」(ノーリファラー)とは何か?
次に「参照元なし」について解説しておこう。この「参照元なし」は、ツールによってその表記はさまざまだ。Googleアナリティクスでも「Direct」「ノーリファラー」「(direct) / (none)」など、表示するレポートによってさまざまな表記がある。
たとえばブラウザのブックマークをクリックすることで閲覧が開始された場合は、直前にハイパーリンクのクリックがないので、参照元は存在しない。こうした場合は「参照元なし」となる。
他にはどのような場合に「参照元なし」の状態になるのか、例を列挙しよう。
- ブックマークによる閲覧
- URLをアドレスバーに直接入力して閲覧
- Webページへのショートカットアイコンをクリックして閲覧
- アプリケーションに記述されたリンクをクリックして閲覧(スマートフォンのアプリ、メールソフト、Word、Excel、RSSリーダーなど)
- セキュアサイト(URLが「https:」で始まるサイト)内のリンクから非セキュアサイト(URLが「http:」で始まるサイト)を訪問した場合
- ブラウザの設定で参照元情報を削除してアクセスした場合
- アクセスの際にプロキシサーバーやセキュリティソフトが参照元情報を削除した場合
- 参照元を引き継がないリダイレクトにより訪問した場合
「参照元なし」はこのように、「リンクをクリックしない方法でサイトのページを訪問した場合」「リンクをクリックしているが参照元が付かないアプリケーションのリンクからのページ閲覧」「ユーザー側やサーバー側の諸設定による参照元の消去」など、さまざまなパターンがある。
「参照元」データが付いてないのが「参照元なし」なので、「参照元なし」の原因、すなわちこれら上記のどれに当てはまるのかの内訳も、アクセス解析データからは当然わからない。
メルマガからの訪問を「参照元」で判別できるか?
メールマガジンを発行しているなら、どの記事がどれぐらい読まれているか、メールマガジンの効果を測りたいだろう。効果を測定する方法の1つとして、メールマガジンに記載されたリンクがどれぐらいクリックされているか、「参照元」を調べることで判別できるのだろうか。
メールマガジンの閲覧方法は、大きく分けてメーラー(メールソフト)を使う場合と、Webメールを使う場合の2つが考えられる。
メーラー | OutlookやThunderbirdのような、デスクトップアプリケーションやスマートフォンアプリなどのメールソフト |
---|---|
Webメール | GmailやYahoo!メールのような、ブラウザで利用するメールシステム |
メールマガジンをメーラーで受け取って、そのリンクをクリックしてWebサイトに訪問してきた場合は、先ほど説明したとおり「アプリケーションのリンクをクリックして訪問」にあたるため、「参照元なし」になる。つまりメーラーでメールマガジンを閲覧されている場合は、「参照元」を見ても判別ができないので、メールマガジンの効果を測定することはできない。
一方、Webメールでメールマガジンを受け取った場合、ブラウザそのリンクをクリックしてWebサイトに入ってくるので、そのときに利用したWebメールサービスのドメインが「参照元」として記録される。このことから、Webメールサービスが参照元の訪問はメールマガジンの効果だろうと想定できる。
ただし最近のWebメールはセキュアサイト(https)化されていることが多く、この場合は前述の「参照元なし」になる場合の例にもあるとおり「参照元なし」になるので、メールマガジンの効果を測定することはできなくなる。
「参照元」以外の方法で流入する元のサイトを知る方法
ここまでの例で、「参照元」はそのままではアクセスの原因や理由を特定するにはあまり精度の高いデータにはならないということが理解できたと思う。われわれはこれを「仕方がない」とあきらめてしまうしかないのだろうか?
「参照元」の情報はそのまま生かしながら、通常「参照元」が取得できないケースについて、流入元のサイトを特定することが可能な仕掛けを施すことが一部可能だ。ここではその方法について紹介しよう。
間にリダイレクトページを挟む
1つは、リダイレクトページの活用だ。
広告効果測定系のツールなら、広告をクリックした後に「リダイレクトページ」を挟んでから、最終的な飛び先に誘導することがある。この「リダイレクトページ」に広告効果を計測するための仕掛けをしておけば、広告がクリックされたことを計測することができる。
リンクのURLにダミーパラメータを付ける
もう1つは、ダミーパラメータを活用する方法だ。
最終的なリンク先を自分のサイトにしている場合に、「ダミーパラメータ」を自社サイトのリンク先のURLに仕込んでおくことで、自分のサイトのアクセス解析で計測できるというものだ。
「ダミーパラメータ」とは、その名のとおり「偽のパラメータ」ということだ。コンテンツに何も影響を及ぼさないパラメータをURLに付与することで「どのリンクをクリックして訪問したのか」を判別できる。パラメータについて詳しくは第5回の記事を参照してほしい。
ここでは「ユーザーがどこから来たか」を把握するため、つまり「参照元」とは別の手掛かりとしてパラメータを使っている。
Googleアナリティクスでは、どのようなダミーパラメータを使うかの形式(フォーマット)が定められている。それについては次回、Googleアナリティクス独特の参照元の定義とともに詳細に解説することにする。
📝筆者が継続的に主催している講座群(Google アナリティクス中心)に興味がある方はこちらをご確認ください。
http://xfusion.jp/train.html
ソーシャルもやってます!