Data Clean Roomとは何か? その活用の可能性を探る(第1回)【電通デジタルコラム】
Data Clean Room連載
プラットフォーム部門
ソリューション戦略部三谷壮平
※所属は記事公開当時のものです。
Data Clean Room(データ無菌室/防塵室)とは、広告プラットフォーム事業者の提供する次世代型レポーティングの仕組みである。
広告プラットフォーム事業者ごとに仕様の差異はあるが、プラットフォーム側が用意したクラウド環境上で、各プラットフォームの広告配信ログデータを、ユーザーのプライバシーに配慮して一定の条件の下で自由に集計したり、それに自社データを掛け合わせて分析/集計できる。また、セキュリティの担保のために、アクセスできるユーザーも限られており、その意味でClean Roomという名称がついている。
従来の管理画面UIに基づく分析機能の場合は、管理画面に用意された切り口での分析しかできないが、Data Clean Roomの場合はSQLなどのデータ操作用言語を使ってカスタマイズした形で集計条件の定義ができるため、分析に対する自由度が非常に高いのが特長だ。
高度な分析を行いたいというマーケティングニーズと、ユーザーのプライバシー保護を両立することのできるソリューションとして今後のデジタルマーケティングにおいて非常に重要なパーツだが、誰もが利用できるわけではなかったり、利用のためには専門知識が必要なこともあって、特に日本における活用事例についてはほとんど情報がない。
代表的なData Clean Roomとして、Googleの提供するAds Data Hubがあり、これは2017年にGoogleの公式ブログにて発表された[1]。電通デジタルは、このAds Data Hubをいち早く利用開始し、数多くのソリューションを開発してきた。こうして開発したソリューションについて、他プラットフォームのData Clean Roomにおいても横展開し、活用の幅を広げてきた3年以上の実績を持っている。本連載ではこれらの知見をもとに、これから5回に分けて、Data Clean Roomについてできるだけわかりやすく解説する。
連載第1回は、Data Clean Roomが必要とされる背景や、なぜ電通デジタルがData Clean Roomに大きな期待を寄せているのかについて改めて整理する。そのうえで2回目以降で、われわれがData Clean Roomを用いてどういったソリューションを提供・開発しているのかをご紹介したい。
※本記事は2021年7月時点での情報をもとに作成しています。本記事の内容は公開情報を元にした電通デジタルの解釈に基づくものであり、プラットフォーム事業者が公式見解として内容を保証するものではありません。あらかじめご了承ください。
Data Clean Roomの具体的な機能
まずData Clean Roomとはどのような機能を持っているのか、について整理してみたい。当然ながら、提供元の広告プラットフォームによって仕様は異なるため、プラットフォームによっては当てはまらないケースもあるが、例外はあれ、おおよそのData Clean Roomにおいては通底する仕様という観点でご紹介する。
広告配信ログデータを自由に分析できる
Data Clean Roomが開発された背景として、ユーザーのプライバシー保護という文脈がある。従来の広告効果の計測はタグベースの計測ツールによって行われてきたが、後述のようにこれはユーザーのプライバシー保護体制が不十分になりうるリスクがある。このことを踏まえて、タグの代替手段として開発されたこともあって、プラットフォームの広告配信ログデータに対して「条件付きのアクセス」(後述)ができるツールである。当然ながら、あくまで広告プラットフォーム事業者が提供する分析ツールなので、分析できるデータもその広告プラットフォームのデータに限られる。
管理画面経由で見ることのできるお仕着せ、かつ集計されたデータではなく、広告を見たりクリックしたりしたユーザーを個人レベルで分析できることは大きな魅力である。
Data Clean Roomの制約
一方で制約も大きい。まず、Data Clean Roomにアクセスして分析や集計をした結果には、ユーザーIDなどの個人レベルの情報はいっさい出力されない。あくまで「指定した条件に当てはまるユーザーが何人いた」という丸められた数字だけが出てくるだけだ。これはユーザーのプライバシーを保護し、個人が特定されないようにするための配慮である。
さらなる制約もある。先ほど「条件付きのアクセス」と書いたが、集計結果が一定の閾値(50~100件程度のケースが多い)未満の場合は、集計結果の数値自体が出力されない。
たとえば、仮に閾値が50件だったとすると、「広告が表示された人」の中で、「女性」かつ「25~44歳」かつ「旅行好き」という条件で検索をして、集計結果が70件あれば「該当ユーザーは70件」と出力されるが、50件未満だと、何件該当したのかの結果は出力されない。
これは、分析条件に当てはまるユーザーの数が50人(件)未満の場合、集計の組み合わせや工夫によっては個人の特定につながりかねないからだ。それぐらい、Data Clean Roomでは個人情報に対する配慮が徹底されている。
Data Clean Roomが求められるようになった背景
それでは、どうして各広告プラットフォーム事業者はData Clean Roomのような環境を用意しているのだろうか。この背景として、プライバシー保護に対するユーザーの声の高まりが挙げられる。
ユーザーのプライバシー保護
ユーザーのWeb上での行動や興味関心に関する膨大なデータが、Google、Facebook、Twitterといったデジタル広告業界の大手プラットフォーム事業会社へ集まっている。
そうした中で、2016年にはケンブリッジ・アナリティカなどの問題[注1]も起きており、インフォマティブデータ[注2]についても適切に保護すべき、という機運が高まっている。
この結果、EUではGDPR(EU一般データ保護規則)が2018年に、カリフォルニア州ではCCPA(カリフォルニア州消費者プライバシー法)が2020年に、それぞれ施行され、日本でも2020年6月に個人情報保護法の改正法案が成立するなど、ルールの厳格化が進んでいる。
こうした動きを受けて、大手プラットフォーム事業者はデータについてより自社での管理が及ぶ範囲での利活用を徹底し、セキュリティにおいて万全を期すためタグを使った外部ツールの計測を打ち切る方向にかじを切っている。「プラットフォーム事業者自身の堅牢なデータ環境の中にある限りは、プライバシーが保護される」という考え方。裏を返せば、自社のデータは、原則外部の計測に提供しない、という意味で囲い込みでもあり、海外ではWalled Garden(壁に囲まれた庭)とも呼ばれている[2]。
計測の透明性や公平性に対するニーズ
一方で、広告効果をより精緻に、詳細に測定したいというマーケティングニーズの観点ではともすると、データプライバシー保護の観点と矛盾するケースもある。
従来のオープンな世界観では、プラットフォーム事業者からは独立した第三者である計測ベンダーのタグをプラットフォームに設定し、計測ベンダーの第三者の基準で広告効果を評価することができた。
ところが、いわゆるWalled Garden化によって、プラットフォーム事業者がタグの受け入れを停止すると、こうした第三者基準での公平な評価は困難となり、プラットフォーム事業者自身が出すデータに基づいた評価しかできなくなる。このことを評して、米の大手広告代理店Omnicom CEOのJohn Wren氏は「プラットフォーム事業者は自分の宿題を自分で採点するような真似をすべきではない」と指摘していることも事実だ。
プライバシー保護と計測の透明性/公平性を両立
こうしたユーザーのプライバシー保護と、計測の透明性や公平性に対するニーズを両立できる仕組みを実現すべく、プライバシーに配慮しつつ自由な分析ができる環境として用意されたのがData Clean Roomだ。
プラットフォーム事業者ごとに対応の濃淡はあるものの、各社とも似たような環境の提供を開始している。
各社とも自社のポリシーに基づいているため、分析の座組や分析に使えるデータのフィード内容は異なるが、共通するのは、ユーザーのプライバシーに配慮していること、そして通常の管理画面では不可能な切り口の分析や、外部データを掛け合わせた分析が可能であることだ。
Cookieフリー文脈への対応
Data Clean Roomは、個人のプライバシーを保護した環境下で広告の効果を計測するニーズから生まれた。調査パネルなどを保有する第三者の計測ベンダーは、従来タグでの計測を行ってきたが、広告プラットフォーム事業者側が外部タグの受け入れを停止することでタグベースでのサービス提供ができなくなっている。しかし、広告主からはこうした第三者の計測ベンダーのニーズは引き続き大きいため、単にタグの受け入れを停止するだけではニーズを満たせない。そのため、タグ経由ではない計測方法が求められるという背景があった。こうした背景から、別の手法での計測手法としてData Clean Roomが提供されるようになったという経緯だ。
これはAppleのITP[注3]をはじめとした3rd Party Cookieの事実上の利用停止に対する1つの解決策としても位置付けることができる。
つまり、仮に広告プラットフォームがタグの受け入れを停止しなかったとしても、3rd Party Cookieが使えなくなると、こうした計測事業者は正しい計測が難しくなる。しかし、Data Clean Roomによって、ログインIDなどを用いた広告プラットフォーム内部のデータを用いた分析が可能になれば、Cookieに依存することなく正確な計測が継続できる、ということだ。
こうした3rd Party Cookieが使えなくなる流れの中で、代替手段として使うことができるという側面は計測ベンダーに対するメリットだけではない。People Driven DMP®という自社のDMPを持っている電通グループとしても、引き続きデータを用いた分析などの活用を行っていくにあたって、Data Clean Roomの利活用は欠かすことができない。今後Cookieによる計測は厳しくなる一方であることからも、Data Clean Roomをしっかりと使いこなしていくことの重要性はますます高まっていくだろう。
クライアント企業にとっても、Data Clean Roomを使いこなすことの重要性は高い。顧客体験の最適化や、顧客理解のために、社内に点在する顧客情報を集約して管理するCDP(Customer Data Platform)を導入する企業が増えているが、このCDPで蓄積したデータを広告プラットフォームで活用する際に、プラットフォームとの接続キーとして使われてきたのもCookieだった。Cookieを媒介として、CDPを中心に各プラットフォームへの施策展開を管理する、という構造となっていたわけだ。
しかし、3rd Party Cookieが利用できなくなるとこの構造が維持できなくなる。こうした構造を、Cookieフリー時代にアップデートする際にもData Clean Roomは欠かせない。Data Clean Roomの中であれば、各プラットフォームの情報と自社CDPの情報をかけ合わせた分析もできるし、施策への接続も可能となる。中心にCDPがある構造自体は変わらないが、各プラットフォームの提供するData Clean Roomの中に、自社CDPのいわば「支店」を作り、必要なデータを掛け合わせることで、従来以上の高度な顧客理解や施策反映を行うことができるようになる。
なお、補足としてData Clean Room=Cookieの利用規制の影響をまったく受けないか、というと、広告プラットフォームによっては受けることを指摘しておきたい。広告プラットフォームと広告配信在庫のドメインが一致する場合(SNS事業者や大手ポータルサイトに多い)は、クロスサイトトラッキングに該当しないため、3rd Party Cookie規制の影響を受けないが、広告プラットフォームと広告配信在庫のドメインが一致しない場合(アドネットワーク系の事業者に多い)は、広告在庫への配信ログの計測がクロスサイトトラッキングに該当するため、3rd Party Cookie規制の影響を受ける。よって、こういったプラットフォームについては、Data Clean Roomを導入したからと言って、広告在庫への配信ログが紐づくわけではないため、Cookieフリーへの対応にはならないことには注意が必要だ。
Data Clean Roomはどのように使うのか
最後に、Data Clean Roomの具体的な特徴について見ていきたい。
分析用UIは用意されていない
「Data Clean Roomは広告プラットフォーム事業者の提供する分析ソリューションである」という説明をすると、勘違いされがちなポイントとして、Google アナリティクスのように、ログイン後のUI上で集計条件を選び、結果が出力されるもの、といったような理解をされることが多い。
ところが、現時点において多くのData Clean Roomではそういった整ったUIのようなものは提供されていないケースが多い。ログイン画面こそあるが、ログイン後に表示されるのはSQLというデータ操作用の言語を入力するインターフェイスだけというのが典型例だ。その意味で、いわゆる誰もが使うことのできるツールではなく、一定のデータ処理・分析のスキルセットを保有した人向けのソリューションだと言える。
分析の自由度が高い
こうした中で、電通デジタルは運用型広告のケイパビリティを持つだけではなく、クラウド環境における分析においても豊富なケイパビリティを持つ。例えばGoogle Cloud Platform領域でもサービスパートナーの認定を持っているし[3]、この分析基盤のうえでSQLやPython/Rを用いた分析の経験も豊富なメンバーがそろっている。こうした、広告と分析両方のケイパビリティを持っていることが、Data Clean Roomの利用について他社に先行して進めることができている要因の1つとなっている。
Data Clean Roomに分かりやすいUIが存在しないことは、ケイパビリティがないと使えないというハードルにはなる。しかしその一方で、きちんと使いこなせる場合には、ゼロベースで集計条件の定義ができるため、分析に対する自由度は非常に高いというメリットにもなる。
APIが豊富に用意されている
加えて、多くの場合APIも豊富に用意されているため、定期的な集計や、結果のビジュアライズの自動化といったパイプラインの構築についても非常にスムーズに行うことができる。この特徴を活かして、電通デジタルでは、APIを用いたセルフサーブ型の分析機能についてもすでに提供を開始している。
次回はData Clean Roomを利用することで可能になる分析について、どういった機能面での特徴があり、従来の分析とは異なるどういった魅力があるのかについてご紹介したい。
脚注
注釈
1. ^ ケンブリッジ・アナリティカは、かつて存在したイギリスの政治コンサルティング会社。Facebook利用者8700万人分のユーザーデータを不正に収集し、イギリスのEU離脱に関する国民投票や、2016年のアメリカ大統領選の政治広告に利用した疑惑で告発された。2018年に破産。2. ^ インフォマティブデータとは、性別や趣味等の個人に関する情報、Cookieに書き込まれた情報、IPアドレス情報、閲覧履歴や購買履歴をはじめとしたインターネットの利用にかかるログ情報等で、個人を特定することができないデータのこと。3. ^ ITP(Intelligent Tracking Prevention)は、Safariユーザーのプライバシーを保護するために、Appleが独自に開発したトラッキング防止技術。3rd Party Cookieによるクロスサイトトラッキングを制限する。出典
1. ^ "Introducing Ads Data Hub: Next generation insights and reporting". GOOGLE MARKETING PLATFORM.(2017年5月24日)2021年9月28日閲覧。2. ^ Pierre de Poulpiquet. "What is a Walled Garden? And why it is the strategy of Google, Facebook and Amazon Ads platform?". mediarithmics_what is?.(2017年11月3日)2021年9月28日閲覧。3. ^ "Google Cloud Platform サービスパートナー認定を取得". 電通デジタル.(2018年6月14日)2021年9月28日閲覧。「電通デジタル トピックス」掲載のオリジナル版はこちらAds Data Hubとは何か?その活用の可能性を探る(第1回)2021/10/05
ソーシャルもやってます!