セグメントを使って、デフォルトでは用意されていない「訪問頻度分布グラフ」を作ってみよう(第60回)
「訪問頻度分布」をグラフを作成して、自分のサイトの実態を正しく把握したい
平均値のワナ
みなさんは、「平均値」という言葉を聞いて、どのようなイメージを持つだろうか? 多くの人は、「だいたい真ん中あたりを表す数値」というイメージを持つのではないかと思う。私もそうだ。
しかし、データ分析においては、この「真ん中あたり」というイメージが、じつは実態とかけ離れているということが往々にしてあるので、注意が必要だ。
たとえば、まずはGoogle アナリティクスで、自分のサイトの「1訪問あたりの平均滞在時間」を調べてみよう。
- 画面上部グローバルナビゲーションの[レポート]をクリックする
- 画面左側にあるメニューで、[ユーザー]をクリックする
- メニューが開くので、[サマリー]をクリックする
この画面の「平均セッション時間」(図1青枠部分)が「1訪問あたりの平均滞在時間」だ。このサイトの例では、「平均セッション時間」が52秒となっている。
平均値から分布をイメージできるか?
では、この「52秒」という平均値から、セッション数の分布をイメージしてみてほしい。
この場合の分布というのは、たとえば以下のように、秒数をある程度の時間で区切って、それぞれの区切りごとにセッション数を記入していく、というかたちになる。
セッション時間 | セッション数 |
---|---|
0~10秒 | |
11~20秒 | |
21~30秒 | |
31~40秒 | |
41~50秒 | |
51~60秒 | |
61~70秒 | |
71~80秒 | |
81秒以上 |
みなさんは、どの「セッション時間」の「セッション数」がいちばん多くなる、と予想するだろうか? 繰り返すが、平均セッション時間は52秒だ。
素直に考えれば、41~50秒、あるいは51~60秒あたりのセッション数がいちばん多くなりそうな気がするのではないだろうか。
「平均セッション時間」の分布を調べてみよう
では、実際に「平均セッション時間」の分布を調べてみよう。「平均セッション時間」の分布を見るレポートは、[ユーザー]>[行動]>[ユーザーのロイヤリティ]レポート(図2)だ。
- 画面上部グローバルナビゲーションの[レポート]をクリックする
- 画面左側にあるメニューで、[ユーザー]をクリックする
- メニューが開くので、[行動][ユーザーのロイヤリティ]をクリックする
- 「セッション時間」(図2赤枠部分)をクリックする
セッション時間の区切り方が少し異なるが、その点はGoogleアナリティクスの仕様ということで、ご容赦いただきたい。
平均セッション時間は52秒(図1青枠部分)だったのに、セッション時間の分布は「10秒以下(ここには直帰訪問も含まれる)」が全体の8割弱を占めている(図2青枠部分)。平均値という1つの数字だけから、ここまで分布が偏っているというのは想像しにくい。
このような現象はこの「セッション時間」のデータに限らない。どのようなデータであれ、平均値だけで判断するのは危険なのだ。ではどうすればいいか。実際に分布データを見るしかない。分布データを見ることで、平均値から漠然と想像したイメージを、より実態に近いイメージに修正できるのだ。
特にアクセス解析では、平均値は比較的心地いい数字(実際より評価が高め・多め)になっていることがあるので、平均値を見るときには、できるかぎり分布も確認しよう。
Googleアナリティクスには、訪問頻度分布を確認できるレポートがない
アクセス解析においては、
- ページビュー数
- ユーザー数
- セッション数
- 訪問頻度(=平均訪問回数)
という4つの数字は、なにはともあれ、まずは確認しておきたい基本的な指標である。このうち、「ページビュー数」「ユーザー数」「セッション数」は、図1の[ユーザー]>[サマリー]レポートですぐに確認できる(図1赤枠部分)。
「訪問頻度(=平均訪問回数)」は、図1には表示されていないが、セッション÷ユーザーと計算すれば、簡単に算出できる。
図1の例で言えば、4,855セッション÷3,100ユーザー(図1緑枠部分)で、この1ヵ月間に1人あたり平均1.57回、サイトを訪問していると言える。つまり、平均訪問頻度が1.57回というわけだ。
最初に書いたように、平均値を見るときには、できるかぎり分布も確認しておきたい。
しかし、Googleアナリティクスでは、この「訪問頻度分布」を表示できるレポートがない。自由度の高いカスタム レポートでも作成できないのだ。カスタム レポートでは「セッション」をディメンションとして指定できないからだ。
そこで今回はセグメント機能で利用可能な「セッション」の指定を使って、訪問頻度分布を作成してみることにする。利用するのは以下のセグメントだ。
- 訪問頻度を指定するセグメント
訪問頻度データを抽出するセグメントの使い方
今回はセグメントのある機能を利用して、訪問頻度の数字を抽出していく作業をしていく。まずレポート画面の上部にある「+セグメント」(図3赤枠部分)のエリアをクリックしよう。ブラウザ表示の横幅が狭い場合は、すべてのセッション(図3青枠部分)の下に並んで表示される。
「+セグメント」(図3赤枠部分)のエリアをクリックすると、図4のようなセグメントの機能が表示されるので、左上にある「+新しいセグメント」(図4赤枠部分)をクリックして新規セグメント作成画面に入る。
新しいセグメントを作成する初期画面では「ユーザー属性」(図5赤枠部分)が選択されているが、今回は「行動」(図5青枠部分)を選択しよう。図5はその「行動」を選択した画面だ。
今回は上部の「セッション」の行(図5緑枠部分)を使用して設定するが、この「セッション」というディメンションが、じつは訪問頻度を指定する項目なのだ。このセグメントは過去の記事でも利用したことがあるので、関心のある方は下記記事もご覧いただきたい。
この画面で、次のような作業をする。
- 「セッション」「=」「1」(図6赤枠部分)となるように「1」を入力(図6緑枠部分)する
- 画面の別の箇所をクリックする(右側にある概要表示機能が自動的に稼働する)
- 「ユーザー数」に表示された数字(図6青枠部分)を、紙やメモ帳に書き留める。
- 「セッション」の数値を1つ増やして、1~3の手順を繰り返す
今回は、セグメントを保存(図5黒枠部分)せずに、セッション(訪問頻度)の数字を、1、2、3…、と1つずつ増やして入れ替えていき、概要表示機能が表示してくれる「ユーザー数」をどんどん書き溜めていこう。
どれぐらい続ければいいのだろうか、と不安になるかもしれないが、心配ない。ほとんどのサイトでは、10を過ぎたぐらいから、「ユーザー数」はぐっと減ってくるはずだ。
そして、「ユーザー数」に0という数字が表示されたら、ほぼ利用頻度の上限に近づいているということなので、それ以上は「××以上」の指定をしてしまおう。今回の例では「セッション」「≧」「15」と指定(図7赤枠部分)した。
訪問頻度分布を整形して一覧表を作る
これらの作業で収集した数字を図8のように、表計算ソフトウェア(Excel)に転記しよう。
左端の列は「訪問頻度」だ。1から順番に記入していく。
真ん中の列「ユーザー数」(図8赤枠部分)には、概要表示機能で表示させた「ユーザー数」(図6青枠部分)を転記していく。
右端の列「セッション数」は、「訪問頻度」×「ユーザー数」で算出した各カテゴリ別のセッション数だ。ここでは計算式を入れて自動的に計算させた(図8緑枠部分)。
図7で最後にまとめて表示させたカテゴリは「15以上」だった。ここには図7青枠部分で概要表示させた「ユーザー数」と「セッション数」をそれぞれ転記する(図8青枠部分)。
最後にすべての訪問頻度別の「ユーザー数」と「セッション数」の単純合計をそれぞれ計算式で計算(図8紫枠部分)する。図1の「ユーザー」と「セッション」の数字(図1緑枠部分)と合致していることが確認できればOKだ。
訪問頻度分布をベースにして、グラフを作る
視覚化した方がイメージがつかみやすいので、グラフも作成しておこう。図8のデータをもとにExcelで作成した図9が、訪問頻度別のユーザー数分布グラフだ。
今回の例では、1人あたり訪問頻度の平均値は1.57回だった。その数字だけを見て想像したよりも、訪問頻度2回以上の割合が低いように思わないだろうか。
訪問頻度の平均値が2~3回になるサイトでも、このように訪問頻度分布グラフにしてみると、それほど多くないという印象を持つかもしれない。あるいは、思ったより多いという印象を持つかもしれない。いずれにせよ、平均値という1つの数字から抱く偏ったイメージを、分布によってきちんと補正しておくということが、データ分析においては大切だ。
頻度分布はそんなに変化するものではない。自分のサイトをイメージで過大評価(または過小評価)して施策を誤らないためにも、年に一度でよいのでぜひ試してみてほしい。
ソーシャルもやってます!