膨大な量のデータを解析し、顧客の傾向を把握したり、予測モデルを作成したりする上で役立つのがデータマイニングです。かつてはCRM(顧客関係管理)などの営業活動や販売促進活動の分野を中心に適用されていましたが、近年はビッグデータを有する企業も多くなり、多様な分野で活用されるようになっています。
データマイニングには多数の手法があり、目的に合うものを選択し、組み合わせて分析する必要があります。では、具体的にはどのような手法があるのでしょうか。
この記事では、データマイニングに使われる主な手法や、データマイニングがもたらすメリットについて例を交えながら解説します。
データマイニングの基礎
画像素材:tomashop / PIXTA
データマイニングは特定の手法を指す用語ではなく、行為の総称です。まずはデータマイニングの概要と、必要な手順についてお伝えします。
データマイニングとは
データマイニングは膨大なデータの中から、データ間の相関関係やパターンといった隠れた法則を発掘することを表します。データマイニングで用いられる分析手法は、回帰分析や決定木分析など多数あり、目的に応じてそれらを組み合わせながら膨大な量のデータを分析します。
注意したいのは、データマイニングよって見つけられる法則が、すべて有益なものとは限らない点です。中にはあまり意味のない法則も含まれているので、有益なものを見分ける必要があります。また、発見した法則のメカニズムまではわからないため、例えば「Aを購入する顧客はBを一緒に購入する可能性が高い」という法則が「なぜ起こるのか」という理由付けは人間側で行うことが求められます。
データマイニングの前に必要な工程
具体的にデータを解析していく前に、データマイニングでは必要な工程があります。主にデータの収集と整理です。
データを収集する
データマイニングでは、分析するデータが多ければ多いほど有益な法則や仮説を発見できる可能性が高まります。そのため、データウェアハウス(DWH)を構築し、情報を蓄積する企業も見られます。自社で用意できるデータを利用するほかに、他社が販売しているデータを購入するというのも収集の一つの手です。
データを整理する
データマイニングでより正確な解析結果を出すためには、データを整理する工程が必要不可欠です。明らかに解析に使わない情報は、あらかじめ削除しておきます。また、データマイニング用のシステムでデータが動作できるようにするには、数値や記号などのデータ形式を統一することも大切です。
データマイニングの主な手法
データマイニングでは、目的に応じて適切な分析手法を選択する必要があります。今回は、数ある手法の中から、主だった方法をご紹介します。
データマイニングのさまざまな手法
データマイニングを行う目的は「分類」「関連発見」「予測」などがあり、それぞれを得意とする手法の例は以下が挙げられます。
- 分類:決定木分析、クラスター分析など
- 関連発見:アソシエーション分析など
- 予測:ロジスティック回帰分析など
では、それぞれの手法について詳しく見ていきましょう。
決定木分析
顧客情報などをツリー形式で階層化し、予測を行う手法です。どのような顧客が商品を購入する可能性が高いか予測したいときなどに使います。定性的な情報を解析する場合に用いられることが多く、図のように分岐を進めることにより、効率よく結果を把握できます。分析する属性を追加するほど決定木の階層は深くなっていきますが、結果がぶれやすくなる過学習の状態にならないよう、注意が必要です。
クラスター分析
クラスター分析は、データを類似性に基づき分類する手法です。類似した性質を持つまとまりを見つけ出し、クラスター(集団)を作ります。クラスター分析を行う上でのルールは複数あり、類似しているものを順にまとめていく階層的手法と、あらかじめ決めた数に分割していく非階層的手法の2つに大きく分けられます。マーケティングでは、顧客のセグメンテーションや競合ブランドの分類などを行う際に用います。
ロジスティック回帰分析
ロジスティック回帰分析は、事象の発生確率を予測する手法です。例えば、DM(ダイレクトメール)を発送した場合の、コンバージョンにつながるか否か(1か0か)というデータであれば、コンバージョンにつながる(=1となる)確率を予測するのに使えます。
ロジスティック回帰分析に類似する手法として重回帰分析があり、こちらは複数の説明変数(原因側のデータ)を用いて目的変数(結果側のデータ)を予測します。
アソシエーション分析
商品やサービス同士の相関関係を見つけたいときに用いる手法です。買い物かごに入れられた商品を見て、人が何を購入しているのか調べるイメージもあることから、「バスケット分析」とも呼ばれます。アソシエーション分析を行うと、例えば「○○と一緒によく購入されている商品は何か?」といったことがわかります。よく知られている事例の一つが「紙おむつとビール(※)」で、異なる属性同士の意外な相関関係が見つかる場合もあります。
※アメリカの大手スーパーマーケットにおける販売データから、紙おむつを購入する顧客はビールを一緒に買う傾向にあることが明らかになったとする事例。1992年にアメリカの経済紙『ウォール・ストリート・ジャーナル』に掲載された記事が始まりとされていて、「データマイニング」がよく知られるようになるきっかけとなった。
データマイニングを行うメリット
データマイニングで得られた法則などは、ビジネスにどう活用できるのでしょうか。用途の例とともに、メリットをご紹介します。
セールスパターンや顧客行動の予測モデルを作成できる
過去のセールスパターンや顧客行動をもとに、どの商品がどのような時期に売れるかなどの予測モデルを作成することが可能です。例えば小売業であれば、以下のような活用方法が考えられます。
- 売れそうな商品を特定し、在庫計画や商品陳列の考案に役立てる。
- 特定の条件がそろったときに売れやすい商品は、条件がそろう時期を予測し、その時期に在庫を多めにする。
例:祭りの日が晴れていればアイスが売れやすいというデータを踏まえ、祭りが近づいたころに天気予報を確認し、当日晴れの予報なら多めにアイスを仕入れておく。 - 一緒に購入されることが多い商品の売り場を同じにする。
例:ペットボトル飲料を買う顧客の多くが紙コップも購入しているというデータを踏まえ、一緒に買いやすいように近くに配置する。
ビジネスの損失につながる事象を防げるようになる
データマイニングで見つけた法則は、品質管理の向上にも役立てることができます。例えば製造業なら、機器の故障に関するデータを収集し、故障が起こりやすい条件と傾向を調査するといった用法が考えられます。条件と傾向を把握できれば、故障が発生しやすい箇所を改善して故障率を軽減し、製造工程の効率向上につなげられるでしょう。
またメーカーであれば、製造プロセスのパターンに関するデータを調査し、分析することによって、ボトルネックや不備のある手法を特定し、改善につなげることができます。
そのほか、データマイニングは不正行為の検出にも活用できます。過去の不正利用に関するデータを解析し、行動などをパターン化しておくことにより、類似する行動から不正行為を検出するといった利用法です。
データマイニングで新たなビジネス機会を創出
以前に比べ、ビッグデータを収集し、蓄積することは容易になっています。しかし、そうしたビッグデータの分析にまで手が回らず、データをうまく活用できているとは言えない状態の企業も多くあります。データマイニングでは、膨大なデータの中から、隠れた法則を発掘(マイニング)します。目的に合わせて適切な分析手法を選び、うまく活用できれば、自社が抱える課題を解決したり、ビジネスチャンスを広げたりすることができるでしょう。
ソーシャルもやってます!