なぜ平均値が計算する人によって3倍も異なるのか? [アクセス解析tips]
1セッションあたりの平均ページビューを計算する
毎回恒例で恐縮だが、最初に簡単な問題を解いていただこう。
下の表は、あるWebサイトの「ページビュー数」「セッション数(訪問回数)」「1セッションあたりのページビュー数」のデータである。中間を省略しているので、日数が12日分しかないが、一応これをひと月の全データであると仮定して、このデータから、2月の「1セッションあたりの平均ページビュー」を計算してみてほしい。面倒くさいかもしれないが、電卓かExcelを使って実際に手を動かしてみよう。
あなたの計算結果はどうなっただろうか?
おそらく、人によって次の2つのどちらかだろう。
A. 2.6
B. 7.1
実は「1セッションあたりの平均ページビュー」と言われた場合に、人によって計算方法が異なることがある。
表の「1セッションあたりのPV数」をすべて合計して日数で割って算出する方法と、ページビュー数の合計をセッション数の合計で割って算出する方法である。
平均ページビュー数が7.1になった人は、「1セッションあたりのPV数」の平均を算出する方法をとった人だ。これは日別の「1セッションあたりのページビュー数」データの日数単純平均値を算出したものだ。日別の指標に変動がなければ、この指標はそれなりに使えるものである。
平均ページビュー数が2.6になった人は、ページビュー数の合計をセッション数の合計で割った人だ。ページビュー数の合計値46,794をセッション数合計値17,792で割ると2.6になる。
人によって計算方法が異なっている可能性がある
ある指標の毎日の「平均」を取るのと、全体の数字を割り算してある指標の「1単位あたり」の数字を算出するのとでは、まったく違う数字になる。この例は2月4日の数字が極端に大きくなっているため、平均の数字が3倍も違っているが、それほど変動がなくても1割ぐらいは変わってしまうのだ。メルマガやニュースサイトの紹介などで月に1~2回大きな変動があるサイトはであれば、実際はもっと変動する場合が多いだろう。
同じようなものが実は計算の順序を変えるだけで倍にもなってしまう。これが統計の怖いところなのだ。あなたが今使っている指標は、きちんと辻褄があっているだろうか。足して合計になるべき指標がそうなっているだろうか。メンバー間で計算方法の統一ができているだろうか? 「2月の1セッションあたり平均PV数」といえば、誰でも同じように計算するだろうという安易な思い込みが、致命的な間違いにつながることもある。
アクセス解析というものは、そもそもエンジニアが自分のために始めたものなので、マーケターからするとおかしいと思われる集計仕様がないとは言えない。盲信すべからずで、疑わしい数字があれば、ツールベンダーからは「計算式」で出してもらうように心がけよう。
また、こうした混乱の原因の1つには、日本語独特の曖昧さもある。英語だと「平均」は「average」で、「~あたり」は「per」と使い分けられるが、日本語の場合は「平均」と「~あたり」の使い分けが曖昧で、どちらも「平均」で表して違和感がない。
日本語は難しいものだが、「平均」あるいは「~あたり」といった言葉をうまく表現しないと、いかようにも解釈できてしまう曖昧さがある。今回の連載では、実話をベースに「1セッションあたり平均PV数」という言い方を使ったが、もし今回の例で厳格に使い分けるなら、「1セッションあたりPV数」の平均を計算する場合は、「1セッションあたりPV数平均」、PV数をセッション数で割る場合は「1セッションあたりPV数」となるだろう。社内の会議やプレゼンの資料などで、どちらを使っているのかわかりにくいことがあれば、遠慮なく確認する癖をつけるようにしよう。
まとめ
- 人によって指標の計算方法が異なっている可能性がある
- 使い慣れた指標であっても、計算方法を確認する癖をつけよう
ソーシャルもやってます!