Attribution.jp分室

アトリビューション分析→シミュレーション→改善の具体的なフロー(やり方)とは?

アトリビューション分析やシミュレーションの具体的な手法を紹介しよう。
attribution.jp分室
アタラ合同会社が運営する、Attribution Management/Modelingについての最新情報サイト「Attribution.jp」より、Web担の読者向けにコンテンツをお届けする。

「アトリビューション分析」とは、コンバージョンに至るまでの流入元の履歴のデータを使い、コンバージョンへの貢献度を各流入元に配分すること。「アトリビューション・スコア」や「アトリビューションCPA」といった指標で広告出稿の本当の効果を見極める、アトリビューション分析やシミュレーションの具体的な手法を紹介しよう。

アタラではこのAttribution.jpを昨年から開始したが、それと軌を一にしてアトリビューションコンサルティングも事業として始めている。ここ最近はアタラに寄せられるお問い合わせの数も増加し、少しずつアトリビューションが日本市場にも普及していることを感じている。しかし、お問い合わせの内容はさまざまで、アトリビューションについての理解度にはかなりバラツキがあるようだ。

御社ではどのようなモデルで分析しているのですか?」という比較的レベルの高い質問もあれば、「アトリビューションって何ですか?」や「アトリビューションってどんなメリットがあるのでしょうか?」というような、基本的なものまで多岐にわたる質問を受けている。また、「アトリビューションというツールについて教えてください」という質問もあり、アタラからの情報発信が少ないために誤解を招いているものもある(ちなみに、今後は分からないが、いまのところ、アタラではアトリビューションのツールを提供してはいない)。

このような状況を踏まえ、アタラでおこなっているアトリビューションコンサルティングについて、その一端を紹介することにした。

アトリビューションというものは、その分析をおこない成果を上げるのには多くの障壁があるといわれていて、現場の実務で実践することが困難であるとの認識がある。事実、実務でおこなうのはとても大変だ。そのような中で、アタラとしては、現状の課題を受け入れつつも、現時点で取得できるデータで対応できる範囲での分析とコンサルティングをおこなっている。そのすべてを紹介するのは難しいが、ここではコアとなる考え方を紹介してみたい。

アトリビューション分析

基本的に、アタラではアトリビューション分析とシミュレーションをコンサルティングサービスとして提供している。

アトリビューション分析とは、簡単にいうと、コンバージョンに至るまでの流入元の履歴のデータを使い、コンバージョンへの貢献度を各流入元に配分することである。

アタラでは、各流入元に割り振った貢献度を数値で示すために「アトリビューション・スコア」という言葉を用いている。また、この「アトリビューション・スコア」で各流入元にかかった費用を割って得られる数値を「アトリビューションCPA」と呼んでいる。これは、これまでのラストクリックだけで算出したCPA(今後は「ラストクリックCPA」と表記する)と同様に、費用を成果で割って得られる数値である。「アトリビューションCPA」では、成果、つまり、コンバージョンにあたるのが貢献度を示す「アトリビューション・スコア」になっている。費用は、これまでのラストクリックCPAと同様に、その流入元に投下した費用となる。

もう1つ、アタラでは「アトリビューション・ランク」という用語も使っている。これは、各流入元を「アトリビューションCPA」によって比較するもので、もっとも効率がよかったものはどれか、2番目によかったものはどれか、という違いを表すために使っていると考えていただければよい。ちなみに、「アトリビューション CPA」と同様に「アトリビューション ROAS」も算出できるが、CPAとROASは逆数の関係になっているだけなので、ここでは「アトリビューション CPA」で説明を進めていくことにする。

それでは実際に、「アトリビューション・スコア」「アトリビューション CPA」「アトリビューション・ランク」をどのように使うのか? 簡単な例でみてみよう。

これまでの費用対効果の算出のやり方

たとえば、最初にバナー広告Aをクリックして広告主のサイトにアクセスしたユーザー(ただしくはブラウザ)がいたとする。初回ではすぐにコンバージョンに至らず離脱するが、その後、しばらくしてバナー広告Bをクリックして広告主のサイトに再訪問する。この2回目のアクセスでもコンバージョンには至らずに、結局、離脱する。しかし、2回の接触を通じてユーザーの記憶に広告主のブランド名が残る。その結果、ブランド名で検索をしてリスティング広告経由で3回目のアクセスをした際にコンバージョンが1個発生したとする。

つまり、バナーA → バナーB → リスティング広告 → コンバージョン となったケースがあったとする。

このときに、投下している費用がそれぞれ、バナーA=100万円、バナーB=200万円、リスティング広告=300万円だったとしよう。まずここで、比較のために、これまでのラストクリックCPAを算出してみる。すると以下の表のようになる。

表1
 バナーAバナーBリスティング広告
費用100万円200万円300万円
貢献度001
ラストクリックCPA算出不可算出不可300万円

発生したコンバージョン1個は、リスティング広告のみのお陰であると考えるのがこれまでのラストクリックでの分析の仕方である。そのため、貢献度を各流入元に割り振ると、表にあるように、バナーA=0、バナーB=0、リスティング広告=1となる。したがって、ラストクリックCPAはリスティング広告のみでしか算出されず、表にあるように、バナーA=算出不可、バナーB=算出不可、リスティング広告=300万円(300万円÷1=300万円)となる。

通常、このような結果をみて「バナーAとバナーBは、リスティング広告に比べて獲得効率が悪い、コンバージョンにまったく貢献していない」と判断されてしまうのが、これまでのやり方だった。

アトリビューション分析による費用対効果の分析のシンプルな例

これに対して、「アトリビューション・スコア」「アトリビューション CPA」「アトリビューション・ランク」を使って表を作ってみる。

表2
 バナーAバナーBリスティング広告
費用100万円200万円300万円
アトリビューション・スコア1/31/31/3
アトリビューションCPA300万円600万円900万円
アトリビューション・ランク123

ここでは、「アトリビューション・スコア」をそれぞれ1/3としている。これは、いわゆる、均等配分モデルを使っているからで、流入元であるバナーA、バナーB、リスティング広告をそれぞれ均等に扱い、発生した1個のコンバージョンの貢献度をそれぞれ均等に割り振っている。この場合は流入元が3つあるために、3分の1ずつ割り振っている。

アトリビューションのモデルについてはいろいろな考え方があるのだが、詳細はまた別の機会に触れることにして、ここでは均等配分モデルで単純に配分したと理解して欲しい。

すでにアクセス解析によって同じユーザーが「バナーA→サイト、その後バナーB→サイト、その後リスティング広告→サイト→コンバージョン」という行動をしていることがわかっているという前提で均等配分モデルを使っているのだと考えてほしい。まず均等配分モデルで検討しているが、その後このモデルを見直すフェーズがあるので、まずは読み進めてほしい。

さて、このように均等に割り振った状態で、それぞれのCPA(「アトリビューション・CPA」)を算出すると、表にあるとおり、バナーA=300万円(100万円÷1/3=300万円)、バナーB=600万円(200万円÷1/3=600万円)、リスティング広告=900万円(300万円÷1/3=900万円)となる。「アトリビューション・ランク」は、バナーA=1、バナーB=2、リスティング広告=3となっている。

表1と表2の違いをみてほしい。表1の方では、リスティング広告が最も獲得効率がよいと判断されていた。一方で、表2では、どうだろうか。説明するまでもないが、最も効率のよいのはバナーA、順に、バナーB、リスティング広告となっている。表1と表2の大きな違いは、各流入元に貢献度を割り振っているかいないかだけだ。それをやるかやらないかで、結果は大きく変わってしまうのである。

これまでの表1のやり方では、バナー広告は効果が悪いということで出稿予算を減らされる、あるいは出稿停止になってしまっていた。しかし、この結果をみると、それが本当に適切なやり方なのかどうか一考の余地があることが分かるだろう。

松井は優秀だけど、イチローはダメ?

日本人メジャーリーガーを例にとってみよう。イチローはシングルヒットを大量に打つバッターで、松井は打点を稼ぐのが得意なバッターである。

これまでの表1のラストクリックCPAで評価するなら、イチローはチームに対してまったく貢献していないことになる。それはなぜか。打点を稼がないからだ。ラストクリックCPAでの評価は松井を過大評価し、イチローを過小評価しているようなものだ。イチローは打点が少ないのに対して、松井は、得点圏にランナーがいるときにきっちりと打点を挙げてくれる。ラストクリックでコンバージョンを発生させるのが得意なリスティング広告のようなものである。

それでは、もし、ラストクリックでのコンバージョンが少ないイチローを評価せずに、先発メンバーから外したらどうなるだろうか。松井のような打点を稼ぐバッターばかりを1番から9番まで並べるのである。

その場合、チームとしての得点力は落ちるだろう。イチローのようなシングルヒットを確実に打つバッターもいないと、効果的に得点を挙げることはできないはずだ。また、そのように評価されているからこそ、イチローは起用され続けているはずだ。いや、年棒だけで判断するならば、松井よりもイチローの方が高く評価されているのが現実のはずだ。

つまり、ここでのバナー広告のように初回や中間クリックを発生させてくれる流入元、イチローのようなバッターもメジャーリーグにおいては高い評価を得ていると考えていい。

チームにおいては、イチローのようなバッターも、松井のようなバッターも必要であり、それぞれのコンビネーションで得点力を高めていくはずである。先の流入経路(バナーA → バナーB → リスティング広告 → コンバージョン)の例も同様で、バナー広告とリスティング広告のコンビネーションでコンバージョン力を高めていくことができるのだ。そして、そのためには、ラストクリックだけを評価する現在のフレームワークを捨てて、初回、中間、ラストのそれぞれを正当に評価するアトリビューション分析が必要なのである。

リアルな事例ではアトリビューション分析をしてみると

さて、ここまでは単純な例を使ってアタラで実施しているアトリビューション分析の基本的な考え方を紹介してきた。次に、具体的なクライアントのケースに沿ったアトリビューション分析と、その分析結果に基づいてシミュレーションをおこなった結果を紹介しよう。

このクライアントは、リスティング広告に月額2,000万円ほど投下し、バナー広告に月額500万円ほど投下していた。合計で月額2,500万円だ。これまでは、ラストクリックCPAで媒体の評価をおこなっており、バナー広告はあまり効果が高くないようにみえるため、需要期以外ではバナー広告は使わないという状況だった。このクライアントから依頼を受け、4月の広告出稿状況とコンバージョンに対してアトリビューション分析を実施した。結果は次のとおりであった。

表3
流入元出稿金額コンバージョンアトリビューション
スコア
ラストクリック
CPA
アトリビューション
CPA
リスティング広告2,000万円20,000件16,7501,000円1,194円
バナー広告500万円1,000件4,2505,000円1,176円

ちなみに、リスティング広告は10万個ほどのキーワードをGoogle AdWordsとYahoo!リスティング広告にそれぞれ出稿しており、バナー広告は純広告、アドネットワーク、リターゲティングなどを含んでいて、それらの集計値、平均値をこの表には掲載していると考えてほしい。ここで、バナー広告にアドネットワークやリターゲティングを入れているのは、あくまでも議論を簡略化するためである。

ラストクリックベースでの評価では、リスティング広告が20,000件のコンバージョンをたたき出し、ラストクリックCPAは1,000円となっている。その一方で、バナー広告は1,000個のコンバージョンでラストクリックCPAは5,000円である。この状態では、バナー広告の評価が低いのも無理はない。

しかし、アトリビューション分析結果の方はどうなっているかというと、リスティング広告の「アトリビューション・スコア」は16,750スコアで、バナー広告の「アトリビューション・スコア」は4,250スコアとなる。そして、「アトリビューションCPA」をみると、リスティング広告が1,194円で、バナー広告が1,176円となっている。これは何を意味しているのだろうか。

つまり、バナー広告は、これまでのラストクリック評価ではコンバージョンが1,000個、「アトリビューション・スコア」は4,250スコアだ。単位はここでは関係ないので、1,000が4,250に増えたと理解していい。この差分「3,250(4,250−1,000=3,250)」は何なのか? これは、初回や中間のクリックでコンバージョンを発生させていたものがこれだけあったということだ。いわゆる、間接効果の数だといっていい。

ここで次のことに注意してほしい。

ラストクリック評価のときのリスティング広告のコンバージョン(20,000件)とバナー広告のコンバージョン(1,000件)を合計すると21,000件になる。リスティング広告の「アトリビューション・スコア」(16,750)とバナー広告の「アトリビューション・スコア」(4,250)を合計すると21,000となって、この両方の数字は同じ値になる。

コンバージョン貢献度を異なるやり方で割り振ったあとでそれぞれを合計しているので、結局、最後のコンバージョン数としては同じになる。この合計値が異なっていれば、計算間違いをしているなどなんらかの原因があるはずだ。

つぎに、「アトリビューションCPA」でみると、リスティング広告=1,194円、バナー広告=1,176円になっている。ということは、間接効果も含めて考えると、わずかながらバナー広告の方が獲得効率が良いという結果が出たのである。そうなると、これまでのリスティング広告重視の姿勢を変更してバナー広告の出稿金額を増やした方がコンバージョン数の増加する可能性も出てきたといってよい。

さらに、このアトリビューション分析結果に基づいて、出稿最適化のシミュレーションを実施してみる。

このクライアントはリスティング広告に約10万個のキーワードを出稿していた。キーワードの中には、コンバージョンに寄与しているものもあれば、寄与していないものもある。当然、コンバージョンに寄与しているキーワードの中には、「アトリビューションCPA」が1,194円というリスティング広告全体の平均値よりも高くなっているものが存在している。これらは、獲得効率があまりよくないキーワードになるため、こうした効率の良くないキーワードへの出稿に投下している費用をバナー広告に再配分するという改善施策が考えられる。

同様に、実は、ラストクリックでのコンバージョンも発生していなければ、間接効果としてのコンバージョンも発生していない(いわゆるアシストもない)キーワードもある。これらのキーワードは、「アトリビューション・スコア」が0になるもので、間接効果も直接効果もないものになる。このようなキーワードも出稿停止にして、そこで使っている費用をバナー広告に配分するとする。

「アトリビューションCPA」が1,194円より高いキーワード群と、間接効果も直接効果もないキーワード群の両方で使っていたコストを割り出すと、このクライアントの場合、約800万円もの金額を捻出できた。キーワードの中には、300円程度でコンバージョンしているものもあれば、5,000円以上かかっているようなものまであった。それらすべての「アトリビューション・スコア」「アトリビューションCPA」を算出し、「アトリビューション・ランク」の低いものから順番にバナー広告へと予算を再配分していく作業をおこなったのだ。そして、「アトリビューションCPA」が1,194円以下で獲得できているキーワード、つまり、効率のよいキーワードだけを残して引き続きリスティング広告を行うことにする。

最初は800万円というのは「ちょっと多いのではないか」と思ったものだ。だが、他のクライアントでも同じような結果が出ているケースがあるので、もしかするとよくあることなのかもしれない。とくに、リスティング広告での出稿キーワード数が多い場合、リスティング広告全体の平均でみたCPAが見合っていればOKとなっているケースが多いため、個別キーワードでコンバージョン貢献度を厳密に測っていないケースがあり得る。今回のケースはそれにあたるのだが、そのような例は他にもあると考えてよいだろう。

このようにして、捻出した800万円をバナー広告にスライドしたとしてシミュレーションを実施してみる。全体の出稿金額は引き続き月額2,500万円で変更はない。まず、バナー広告経由でのコンバージョン数はどうなるだろうか。

1コンバージョンが「アトリビューションCPA」=1,176円で獲得できるとすると、800万円をバナー広告に追加で投下することによって、6,800件のコンバージョンが追加的に獲得できることになる。ただ、ここでリスティング広告でのマイナスの影響も考慮しないとならない。リスティング広告では800万円の出稿金額を減らすことになる。この800万円はさきほど説明したとおり、「アトリビューションCPA」が1,194円より高いキーワード群、それと、間接効果も直接効果もないキーワード群の両方から捻出したものなので、これらのキーワードで獲得していたコンバージョンは減ることになる。その数を計算すると、約2,000件のコンバージョンがあった。つまり、800万円をリスティング広告からバナー広告にスライドさせることによって、コンバージョンが2,000減って6,800件増えるためトータルは4,800件のコンバージョンが増加するというシミュレーション結果になった。

出稿金額は月額2,500万円のまま変更なしで、4,800件のコンバージョンが増加するという結果だ。表3にあるとおり、4月の実際のコンバージョン数は21,000件だ。同じ予算でコンバージョン数が4,800件(約23%)も増加するというのは、とても大きいといえるだろう。

たかがシミュレーション、されどシミュレーション

この最適化シミュレーションはあくまでもシミュレーションであって、出てきた数値も参考値程度に解釈すべきものである。そもそも、シミュレーションとはそういうものであって、予測してコンバージョン数を正確にあてようとするものではない。とくに、今回のシミュレーションでは、4月に発生した流入経路のすべてが5月にもまったく同じだったと仮定して算出していることになるが、当然のこととして、初回、中間、ラストに至る流入経路が4月と5月でまったく同じであることはあり得ない。初回、中間、ラストのコンビネーションは変わるはずである。また、アトリビューションモデルも均等配分でおこなっているが、実際には他のモデルを当てはめた方がよいという可能性も否定できないであろう。そのため、あくまでも単純なシミュレーションであると理解してほしい。

ただし、確かに単純なシミュレーションではあるが、しかしながら、まったく意味がないかといえば、そんなことはない。単純なモデルと単純なシミュレーション方法で導いた結果とはいえ、これまで貢献度を評価していなかったラストクリック以外の各流入元についても考慮した上でシミュレーションをおこなっている。少なくとも、ラストクリックだけに偏っていたこれまでの手法よりは現実に近い形で評価ができている可能性があるはずだ

どの程度、このシミュレーション結果が確からしいのかを調べるためには、シミュレーションにしたがって実際に800万円分をバナー広告にスライドしてみればいいのである。ただ、クライアントには確からしさを調べたいというような冒険心はないのが普通だ。当たり前である。実際のお金を使ってマーケティングをおこなっているからだ。今回の分析では、バナー広告の獲得効率が良い可能性があり、シミュレーションの結果にしたがえば4,800件もコンバージョンが増えると主張しても、クライアントは「わかりました、やりましょう」とはならない。クライアントはもちろん半信半疑だった。いろいろと議論した末に、実験的に200万円分だけバナー広告へスライドさせてみることに落ち着いた

スライドさせた結果をいうと、結果的にコンバージョン数が500件ほど増えたのだ。実は、200万円分で同様のシミュレーション計算をすると、800件ほどのプラスになるという結果が得られていたので、それと比較すると、やや下振れしたことになる。シミュレーションの結果どおりにはならなかったが、月額2,500万円でコンバージョン数は21,000件から21,500件へと2.3%ほど増えたことになる。

200万円をリスティング広告からバナー広告にスライドさせたことによって、獲得効率はよくなったといってもいい。もちろん、断定はできない。コンバージョンが増えた理由は、季節的な要因などもあり得るし、バナー広告のフリークエンシーなどが変化したことや、初回、中間、ラストのコンビネーションが大きく変化したことなども影響を与えるかもしれない。200万円をスライドさせたこと以外にもいろいろと検討する余地があるのはたしかである。

コンバージョンへの影響はさまざまな要因が考えられるため、単純化して考えることにリスクが伴うのは承知している。しかし、現場で実際に最適化のオペレーションをおこなっていくためには、ある程度の単純化はやむを得ないと考えている。さまざまな要因があり得るとはいえ、それらを厳密に分析することが非現実的である以上、分析できるデータと使用可能なモデルを使ってソリューションを導き出し、少しでも前に進んで行く方が懸命であろう。すくなくとも、これまでのラストクリックでの評価よりは良い分析ができるはずだ。ラストクリックでの評価は、ここで紹介しているものよりもはるかに単純な手法であるのはいうまでもない。

予測と結果の差異をみてシミュレーション前提を改善してくメソッド

さて、コンバージョンが増加した要因はさまざまなことが考えられるが、仮にそれらが変化しなかったとしよう。200万円をスライドさせたこと以外は変化しなかったと仮定するのである。そうすると、このシミュレーションでは800件増加すると考えていたコンバージョンと、実際の500件増加のコンバージョンの差異(300件)は、何から発生しているのだろうか。

この差異は、アトリビューションモデルとして均等配分を採用していることから発生していると考えられる。つまり、リスティング広告もバナー広告もすべて均等に配分して「アトリビューション・スコア」「アトリビューションCPA」を算出していたのだが、他の条件が一定として考えると、このシミュレーションの結果が下振れしたということは、その分だけ、バナー広告への評価を高めに配分してしまっていたと考えられる。つまり、本当はもっと低めに配分した方がよかったといえるのだ。

したがって、次回のアトリビューション分析では、リスティング広告とバナー広告への配分を均等ではなく、バナー広告への配分を少し割り引くことで、このクライアントへのアトリビューション分析とシミュレーションの精度を向上することが可能であろう。

ところで、他のクライアントでは、シミュレーションよりも上振れすることもあった。その場合は、バナー広告への配分を少し割り増して、再度アトリビューション分析をおこない、シミュレーションすることになる。

このように、シミュレーション結果と実際のテスト結果との差異(上振れ/下振れ)に応じてアトリビューションモデルの修正プロセスを繰り返しおこなっていくことで、全体の精度が向上していく。この繰り返しの手法を、アタラでは「プログレッシブ・オプティマイゼーション・アプローチ(Progressive Optimization Approach)」と呼んでいる。また、「アトリビューション・スコア」「アトリビューションCPA」「アトリビューション・ランク」を使ってアトリビューション分析を実施し、最適化シミュレーション、そして、プログレッシブ・オプティマイゼーション・アプローチを取る一連の方法を、「アタラ・メソッド(ATARA Method)」と名付けて紹介している。

先述したメジャーリーガーの例でいえば、このアタラ・メソッドによってイチローの貢献度を、これまでのラストクリックベースの評価に比較してより正当に評価できる。その結果、全体の得点力=コンバージョン力の向上につながるのである。

今回のアタラ・メソッドの紹介では、議論を簡略化するために、リスティング広告とバナー広告という2つに流入元を分けて考え、最適化シミュレーションの例を紹介している。実際の現場の実務においては、さまざまな純広告、タイアップ広告、動画広告、アドネットワーク、アフィリエイト、ソーシャルネットワーク、リスティング広告、自然検索など、多数の流入元別に分析することになるため、リスティング広告からバナー広告への出稿予算のスライドという単純なシナリオになるとは限らない。また、リスティング広告への出稿金額に対してバナー広告への出稿金額が少なすぎた場合には、シミュレーションがうまくできないケースも実際にあった。というのは、初回や中間でコンバージョンに影響を与えているクリック数があまりにも少なかったために、バナー広告の「アトリビューションCPA」が非常に高い数字になってしまったのである。

このように、実務においては今回紹介したケースよりも複雑であるし、場合によってはうまくシミュレーションできないケースもあるのはたしかだ。

しかしながら、多くの場合はサイトカタリストなどの効果測定ツールでコンバージョン・パスのデータ、つまり、流入経路と流入元のデータが計測できているならば、ここで紹介した方法を使ってコンバージョンの効率を向上できる可能性が高い。ラストクリックだけを評価していた評価方法から脱却し、初回、中間の各流入元まで含めて評価する方法を使って、コンバージョン数を増加できる可能性は大きい。もし、データが計測できているのであればぜひ、アトリビューション分析をご自分でも試していただきたい。それによっては得られるメリットは大きいと信じている。

アタラ合同会社 COO 有園雄一

アトリくん

この記事は、attribution.jpに掲載されたコンテンツをWeb担の読者向けにピックアップ/再編集してお届けしている。この記事のオリジナルはこちら
アタラのアトリビューションコンサルティング(2011年7月6日)

用語集
AdWords / CPA / アクセス解析 / アフィリエイト / コンバージョン / ヒット / リスティング広告 / リターゲティング / 自然検索 / 訪問
この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

Python
「Python」(パイソン)は、プログラミング言語の1つ。プログラマのグイド・ヴ ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]