電通デジタルコラム特選記事

GA4とGTMで消えゆくCookieの実態を徹底調査:リピートユーザーの判定率はわずか47.8%【電通デジタルコラム】

サードパーティCookieは、実際、どの程度リセットされているのか?リアルデータを用いて可視化した調査結果を解説。

プライバシー対策からCookieレスは話題となっていますが、各種のマーケティングや広告ソリューションのCookieへの依存はまだ断ち切れません。実際、Cookieはどの程度リセットされているのか?精度はどれくらい落ちたのか?「CX UPDATES」(以下、本サイト)のリアルデータを用いて可視化してみました。


Cookie調査のためにGA4を活用

本サイトは、立ち上げ当初(2019年5月)からGoogle タグ マネージャー(以下、GTM)のサーバーサイド コンテナを用いて、安全で消去されにくい(Http-OnlyでSecureな)「FPID」のサーバーCookieを発行しています。この値を、ブラウザ側でJavaScriptにより発行される従来の「_ga」Cookieの値と紐づけて検証することにします。

この2種類のCookieは、検証のためにGoogle アナリティクス 4(以下、GA4)で計測していました。

手法としては、GTMサーバーサイド コンテナで作成したGA4タグの設定で、以下のように従来の「_ga」Cookieの値をイベント パラメータへ、消されにくい「FPID」サーバーCookieの値をユーザー プロパティとしてセットしています。

i-i-o-d-c-w-a-d_01

従来の「_ga」Cookieの値はセッションの途中でリセットされて値が変化するので、ユーザープロパティではなくイベントパラメータとして計測しています。その値の先頭に「_」(アンダースコア)を付与しているのは、型を数字ではなく文字列としてGA4に認識させるためです。

この設計と実装でデータを9カ月間収集し、GA4から以下のデータを、BigQuery経由で抽出しました。

● 「FPID」サーバーCookieに格納された、サーバーサイドで発行されるクライアントID
● UA(旧GA)のJavaScriptが発行する「_ga」Cookieに格納された、従来のクライアントID
● OSの種類
● ブラウザの種類
● 日付
● ランディングページ
● 流入チャネル

半年間の実データで明らかになった実態

半年間のGA4データを抽出し、Tableauで可視化してみます。

まず、「FPID」サーバーCookie(1つのブラウザ)に対して、分断された従来の「_ga」Cookieを紐づけます。


i-i-o-d-c-w-a-d_02

表の3行目で、1つのFPIDに対して従来のCookieが3つ紐づいていることが分かります。同じブラウザなのに、従来のCookieが途中で消去され、新しいIDが付与されたためです。

この結果、Google アナリティクスや、各種のマーケティングや広告ソリューションにおいて、ユーザー数が3人として扱われてしまいます。

一方、自社のサブドメインを割り当てたGTMのサーバーサイド コンテナを使ってファーストパーティのサーバーCookieを発行すると、ブラウザはそのCookieを安全なCookieとして認識し、リセットの対象になりません。そのため、3人のユーザーとして分断されず、以前のように「1人」のユーザーとして扱われるようになります。

SafariやiOSのITPなど、ブラウザの仕様によって、Cookieがリセットされる条件や残存期間が異なります。そのため、一人ひとりのユーザーがサイトにアクセスした日付も考慮してガントチャートでCookieの残存を可視化してみます。

分かりやすくするため、2人分のデータを抽出しました。


i-i-o-d-c-w-a-d_03

上のユーザー(FPID:08cS9G..)は、期間中に合計27日にわたってサイトにアクセスしました。途中に17日間アクセスがない期間が2回ありましたが、Cookieは消えることなく、UA(旧GA)上でも同一ユーザーとして認識されています。

一方、2〜4行目のユーザー(FPID:tXCRbrn..)は、1カ月ぶりとなった3回目のアクセスでCookieがリセットされ、新規の別人格として誤認識されました。さらにその6日後、またCookieがリセットされますが、その後はCookieが消えることなく、同一ユーザーとしてのアクセスが続いています。

GTMのサーバーサイド コンテナからサーバーCookieを発行しているGA4では、2〜4行目のユーザーを正しく同一ユーザーとして認識できています。

このように、ツールの導入方法によって、以下のような指標の違いが生じています。

 サーバーCookie
GA4
従来のCookie
UA
乖離
ユーザー数(UU)13200%
平均セッション数27.09.0-67%
平均サイト利用期間113.0日間25.3日間-78%

上で抽出したデータはまだデータの乖離が少ない方です。以下のように、ほぼ毎回新規ユーザーになってしまうケースも見受けられます。

i-i-o-d-c-w-a-d_04

最初は広告で本サイトを知り、1ページのみ閲覧して直帰。その後、リマーケティングにより再訪問し、回遊して閲覧したコンテンツが悪くなかったのでサイトや運営会社が印象に残り、しばらく経ってからサイト名を検索して自主的に再訪問し、その後はときどき新しいコンテンツをチェックする習慣が根づいた、という心理と行動の過程を把握することができます(ユーザー エクスプローラーのレポートも併用するとより深い洞察を得られます)。

この分析は、GTMサーバーサイド コンテナでサーバーCookieを導入したからこそ可能になりました。通常の方法でUA(旧GA)やGA4を導入していたら、「広告によって新規ユーザーを3人獲得。自然検索の方が11人も新規を獲得できている。ただし、直帰してしまい、回遊や定着にはほとんどつながっていない」という全く異なる分析結果になっていたことでしょう。

Cookieのリセットでユーザー数が重複計測される

ここまでは、ユーザーを何人かピックアップすることで、定性的にCookieのリセット状況を調べてきました。次に、どのような状況でどの程度データが分断されているのか、網羅的に調べてみます。

まずOS別で、ユーザー数(UU)が平均で何倍に増えているかを集計してみます。1人のユーザー(1つのFPIDサーバーCookie)に対して、途中でリセットされて再発行された_ga Cookieの数を「UU重複計測率」としました。


i-i-o-d-c-w-a-d_05

iOSでの影響が大きいと予想していましたが、意外にデスクトップ(WindowsやMac)の方がUU重複計測率が高い、と分かります。

さらにブラウザの種類で分解すると、以下のようにUU重複計測率に差が出ました。


i-i-o-d-c-w-a-d_06

OSを問わず、Firefoxはプライバシー保護機能が強く作動していますが、ユーザー数(UU)が少ないので、サイト全体のデータへの影響は軽微です。

MacのSafariとiOSはITPによる保護機能がよく知られていますが、実はChromeでも同じくらいのレベルでCookieのリセットが発生しています。

UU重複計測率は、サイト全体の平均では7.8%でしたが、本サイトは、この時期はユーザーのリピート率が6.2%と低かったので、他のサイトではもっとUU重複計測率が高くなるはずです。

リピート訪問者の約半数は新規訪問者としてカウントされてしまう

新規とリピートで分けて、以下のように整理しました。

 サーバーCookie
FPID
従来のCookie
_ga
乖離
新規59,48059,89411.5%
新規(偽)6,399
リピート3,9212,045-47.8%
合計63,40168,3387.8%

リピート訪問者のうち、47.8%がCookieのリセットによって新規ユーザーとして誤認識されている、という驚きの結果になりました。この割合を目安にすると、他のサイトでもどの程度ユーザー数が割り増しされているかを算出することができるでしょう。

ただし、サイト全体のユーザー数という指標は、あまり分析では役に立たない指標なので、この数字に一喜一憂する必要はありません。

それよりも、以下のような集客やサイト利用の質を判断するための計算指標の方が重要です。

● 一人当たりの平均閲覧ページ数(コンテンツの内容や導線によって回遊を促進できたか?)
● 一人当たりの平均セッション数(広告やメール、SNSなどによるリテンション施策は効いているか?)
● リピート訪問までの平均日数(サイト利用が定着して習慣になったか?)
● トップページへのオーガニック再訪問率(知名度が高まった結果、わざわざサイト名や社名で検索して再訪問してくれる人は増えたか?)

これらの指標は、ユーザー数を使って算出するので、ユーザー数よりも大きく数値がブレます。

マーケターはどうすべきか?

GA4の進化でも明らかになったように、人起点の分析やマーケティングは、留まることなく進化を続けていきます。現段階で「ユーザー指標やファーストタッチの分析は精度が落ちている、やらない方が良い」と判断し、ユーザー軸の分析を諦め、セッション単位やラストタッチの分析へ軸足を移すのは早計です。現実を客観的に捉え、できることは先行着手し、時代の流れをみながら前向きに進んでいきたいものです。できること、すべきことはいくらでもあるはずです。

● 訪問者を特定するCookieをファーストパーティのサーバーCookieへ移行する
● Cookie消去の実際の影響範囲をデータで把握する
● 企業にとっても顧客にとっても望ましい顧客行動について具体的に定義する
● データ取得に関して、用途や範囲などの説明と合意の取得をしっかり行う
● GA4の導入をきっかけに、取得すべきデータの定義と実装を見直す
● 全データの取得は過去の幻として諦め、顧客から合意を得られた安全なデータを統合し、顧客の心理や行動の理解を深める
● 顧客データを活用し、企業側のコスト削減や効率改善だけでなく、顧客体験やサービスの改善に活かすことで、満足度やロイヤルティを高める

電通デジタルでは、上記のような方針を考慮したGA4導入支援のほか、Cookieに依存しない"Cookieフリー時代"に向け、ユーザーのプライバシー保護と正確な行動計測が両立できるようなマーケティング施策の最適化を支援しています。お困りの際はお気軽にご相談ください。

清水 誠 Makoto Shimizu

チーフ アナリティクス オフィサー(CXO)
組織のデジタル化を推進し続けて25年。UXの開拓、IT部門の社内改革、マーコム部門のデジタル改革、楽天におけるWeb解析の全社展開を経て2011年に渡米。ユタ州にてAdobe Analyticsのプロダクトマネジメントを担当した後、2014年に帰国し電通レイザーフィッシュに参画。カスタマーアナリティクスやコンセプトダイアグラムを提唱し、その実践や普及の活動をしている。2013年Web人賞受賞。「清水式ビジュアルWeb解析」著者。

記事一覧

「電通デジタル CX UPDATES」掲載のオリジナル版はこちら GA4とGTMで消えゆくCookieの実態を徹底調査:リピートユーザーの判定率はわずか47.8%

用語集
JavaScript / SNS / UA / セッション / 直帰 / 自然検索 / 訪問 / 訪問者
この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

Python
「Python」(パイソン)は、プログラミング言語の1つ。プログラマのグイド・ヴ ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]