仕事に活かせるアイデアが盛り込まれた統計計算のツールボックス/書評『STATISTICS HACKS』
BOOK REVIEW ウェブ担当者なら読んでおきたいこの1冊
『STATISTICS HACKS 統計の基本と世界を測るテクニック』
評者:斉藤 彰男(編集者、システム・エンジニア)
統計計算に欠かせない技を集めた“ツールボックス”
仕事に活かせるアイデアが多数盛り込まれているのが魅力
- ブルース・フレイ 著、鴨澤 眞夫 監修、西沢 直木 訳
- ISBN:978-4-87311-335-7
- 定価:2,400円+税
- オライリー・ジャパン
統計は、ウェブのアクセス解析のみならず、社会学の調査や自然科学の実験を行う上では必要欠くべからざるテクノロジーである。ここをきちんと押えておかないと、多くの時間とコストをかけてやった苦労が、結局は無意味だったという悲惨な結果をもたらすことさえある。
ところが、多くの人にとってこの統計を勉強することは、長時間の学習の苦痛に耐えることになってしまう。実際に近々統計を使って仕事をしなくてはいけない人、でも一から学習するほど十分な時間はないというジレンマに陥った人にお勧めの書籍が出版された。
本書は、オライリーのHACKSシリーズの一冊であることから容易に想像できると思うが、統計に関する数々の技とエッセンスが60のHACKSの中に凝縮されている。実際に統計を使う上で忘れてはいけないチェックポイント、重要な統計指標を計算する式、計算結果の数値をどう読むべきかといった実践的なものばかり詰め込まれていて、「必要なときに、目次を見て該当するページを開く」といった辞書的な使い方ができるのが特徴だ。
本書は、1章 統計の基本、2章 関連性を見つける、3章 世界を計る、4章 ゲーム、5章 うまく考える、の5章に分けられている。タイトルを見れば想像できるだろうが、1章から3章までが、いわば“基礎編”4章以降が“応用編”といった内容だ。“基礎編”といっても、さすがにこの分野の知識がまったくゼロの人には、ちょっと敷居が高いだろう。そのような人は、まず入門書をざっと通し読みしてから、本書に手をつけるのが良い。まずは、1章から3章までを熟読することを勧める。統計に必要な基本テクニックは、ここにすべて収められているからだ。もし途中で意味のわからない専門用語に出会ったら、Wikipediaで調べるといいかも知れない。本書ではよくあることなので、細かな点は気にせず、ひたすら要点を理解するように心がけよう。
次に、この本を購入するかどうかを判断する際の注意点だが、本書は統計のテクニックを集めたものなので、実際に「どうプログラミングするか」という“実装”の部分にはほとんど触れられていないのだ。エクセルが得意な人はエクセルを使えばいいし、「S」や「R」といった統計言語を使う人はそれもまた良し、といったスタンスだ。したがって、計算プログラムのCD-ROMも添付されていない。
もし、統計プログラミングの経験が豊富でない人は、エクセルを利用することを推奨する。確率・統計に特化した解説書も十冊以上出版されているし、何よりもエクセルの統計機能の充実ぶりには定評がある。平均、標準偏差、カイ二乗検定といったよく使われる計算は「関数」として用意され、また計算した数値をグラフにする機能も充実している。アドインの「分析ツール」を使うと、さらに高度な分析も可能になる。統計の専門家もツールとして手放せないのがエクセルだ。
そして、目先の仕事が一段落して時間的に余裕ができたら、本書の5章に目を通すと良いだろう。この章は、文章を作成する際の単語分布の“くせ”から書いた人を判定するHACKとか、自然発生的なデータでは最初の有効数字は統計的に見ると偏りがあり、小さい数字ほど頻度が高くなる(ベンフォードの法則)という性質を使うと、データの信頼性をチェックできるといったHACKが紹介されていたりして、読み物としてはいちばんおもしろい。ここには、仕事のさまざまな局面で適用できそうなアイデアが散りばめられていて、読み進めていくと、きっと夢が広がるようにアイデアが湧き出てくることだろう。
ソーシャルもやってます!