勘と経験によらないデータ分析での仮説の立て方とは?
データビークルのデータ分析ツール「Data Diver(データダイバー)」「Data Ferry(データフェリー)」はデータサイエンスを用いて「打ち手」の有効性を科学的に証明する。両製品の魅力、そしてデータサイエンスの意義をデータビークル代表取締役の油野(ゆの)達也氏に話を聞いた。
データを「見える化」しただけでは「データ分析」ではない!
――Data DiverとData Ferryの2製品を作られた経緯を聞かせてもらえますか?
油野達也氏(以下、油野):弊社データビークルの西内が『統計学が最強の学問である』という書籍を出してから、「データを分析して次の打ち手を見つけたい」と考える企業さま向けにデータ分析のプログラムを書いていました。そのノウハウをソフトウェアにすればたくさんの会社で役立つだろうと思い、パッケージ化したのがData DiverとData Ferryです。
――依頼のあった企業ではデータ分析にどんな課題があったんでしょう。
油野:BIツールなどで作成したグラフを眺めて「データ分析をしている」と考えている方がまだまだ多いんです。それはあくまで基本的な情報を集計して把握する「見える化」の段階で、実は「分析」には至っていないんですね。それなのに並べたグラフをもとに「勘と経験」で判断してしまう。つまり、データを元にしているものの、そこから導き出した「原因」や「対策」にはデータを何の科学的な証明もないんです。
科学的なデータ分析とは?
――なんとなく良い施策を思いつく人を「勘がいい社員」と呼んだりしますよね。
油野:「勘がいい」というのはデータを見て、なぜそうなるのかっていう要因によく気づく、ということですよね。でも、やっぱり勘だから当たったり外れたりするんです。
――「勘と経験」で立てた仮説は突き詰めると「なんとなくこのデータ間に関係があるような気がする」みたいな弱い根拠しかないんですよね。
油野:企業・ビジネスマンがリソースを投じて何かを行う以上、売上・原価・収益といったビジネス指標に影響する、強い因果関係にこそ働きかけるべきなんです。多様なデータを「総当たり」で検証して初めて、ビジネス成果をもたらす要因に「科学的」にたどり着けるんです。
顧客を増やしたり、売り上げを上げたりするために本当に必要なアプローチを見つけるためにデータサイエンスを用いた分析が必要なんですね。
データ分析における「第3の選択肢」となるData Diver
――Data Diverの特徴やメリットを教えてください。
油野:Data Diverで分析を行うと「ダイレクトメールの送信が月の中旬だと客単価が高い傾向にある」といったような因果関係が「仮説」として多数表示されます。この仮説をさらにBIツールなどで検証することで「有効な打ち手」に効率的に辿り着くことができます。
でも、今の企業にはExcelを使える人はいても、データサイエンスを用いた分析をちゃんとできる人はほとんどいない。では、データサイエンティストを採用できるかというと売り手市場で優秀な人材は採用できない、育てるにもノウハウがない。かといってコンサルティングを頼むと高い。ならば、「データサイエンスを用いた分析」を誰でもできるツールがあればいいのではないかと作ったのがData Diverです。
Data Diverは画面を見ながら会議を進められるんです。
候補として上がった仮説候補のなかには、自明のものもあります。関係者が集まって仮説の候補を1つずつ確認しながら「これは知ってる」「これは要因ではない」というものがあれば、ツールの画面上で除外条件をクリックひとつで消すことが可能で、その後データを再計算しすぐ表示できます。
データ分析において一番大切なのは、仮説をきっかけにしてディスカッションを行うことだと考えています。円グラフをながめているだけでは解決できません。
こうしたツールはこれまであまりなくて、自分たちでプログラムを書くかコンサルタントに頼む、この2通りの選択肢しかなかったんです。Data Diverを使えばコンサルタントに頼むよりずっと安く、速く、しかも会議中のフィードバックをもとにその場でデータの再処理さえできてしまうんです。
――データはどれくらいのボリュームが必要ですか? 超大量のデータを読ませないと、ヒントが出てこないのでは……
油野:「Webのアクセスデータ」「顧客マスターデータ」「商品マスターデータ」くらいがあって、この3つを紐付けられれば大丈夫です。設計のよいアンケートなら200~300の回答で因果関係の候補を見つけられますよ。
――Data Diverは、仮説を出し、議論のベースを作り、打ち手を考えるのが目的のツールだから、データが多くなくても大丈夫なんですね。
実際の出力データには補正効果も
油野:Data Diverでは、単に生データを並べるだけでなく、適切な統計手法で補正をかけたグラフの出力も可能です。
こちらのサンプルは、ある商品の購買金額とお客さんの年齢を散布図で表したものなのですが、年齢以外の条件がすべて一緒だったらどうなるのかという補正処理をしたデータを示しています。
分析フローをマウス操作だけで効率的に
――Data Ferryについても紹介していただけますか。
油野:Data Diverのような分析ツールを使うには通常、元のデータを分析ツールで扱える形式に変換する必要があります。
Data Diverを使いだすとどんどん新しいデータが欲しくなるんですが、そのたびにデータの出力を技術担当に頼むと大変なんですよ。忙しいと「2週間待って」と言われたり(笑) ですので、IT部門に頼まなくてもデータ分析担当者が自分の机で全てできるようにしたのがData Ferryです
データ出力のパターンとして、社内の情報システム部に頼んで分析用のデータをもらったりすることがあるかと思います。けど彼らは忙しいし、せっかく出力されたデータにカラムが足りないとか数値にイレギュラーな値が入っている行があるとかで再度出力をお願いする、など時間がかかることで悩んでいる方もいると思います。
Data Ferryを使えば情報システム担当者が格納してくれたデータを分析担当者自身で取得して、キレイに並べて、Data DiverやBIツールで分析するためのデータとして加工できます。通常のEAIツールでもできますが事前に使い方を勉強しないといけませんが、Data Ferryはマウス操作だけで使えるんです。
――データコネクターであり、データクレンジングのためのツールでもあるんですね。
Data Ferryはデータクレンジングだけではなくハズレ値を見つけることができます。例えば年齢カラムに999歳とかあれば除外し、年齢・ageといったカラムの異なるデータをまとめることができます
――ツールの価格帯としてはいかがでしょうか?
Data DiverとData Ferryはいずれもクラウドサービスで、Data Diverは月額使用料60万円、Data Ferryは40万という設定です。Data Ferryはオンプレミスで年間200万円というサブスクリプションという設定もあります。価格は1アカウント単位の設定ですが、3プロセスまで同時稼働しますので複数名での利用も可能です。
実際どんな方が使っている?
――今利用しているクライアントやユーザーは、どんな業種や立ち位置の方が多いですか?
油野:業種としてはBtoBtoCが多く、ユーザーはマーケティング部や経営企画部の方が多いです。経営企画だと出店計画に使われていたり、NPSのデータを元にロイヤリティを高めるコミュニケーションを検討したり、Webやアプリの広告絡みで利用しているクライアントさんも多いですね。
「BIツールは使いこなせるしデータも正しく把握できる、けれどデータをどう活用してビジネス目標を達成すればいいかわからない」という方、いわばBIツールを "卒業" された方に導入を検討してほしいですね。
データ分析に使えるセミナーも
データビークルでは統計学の基礎講座を実施しています。 データ分析の基礎を習得していただきたくもので、「数値データと属性データでは分析の方法が異なりますよ」といったところからお教えしています。講座は4日間で1日2時間やっていて、会社帰りに来ていただけるようにしています。
データ分析を正しく行ってもらうための人づくりから始めて、データ分析担当者の成長をサポートしたいと考えています。
――ありがとうございました
ソーシャルもやってます!