代表的な4つのグラフの使い分けのポイント(第2回)
前回の第1回では、なぜグラフ化のスキルが重要であるかという点をお話ししました。これから派生形を含めて最終的には9種類のグラフについて順に解説していきますが、第2回となる今回では、よく利用される4種類のグラフの特徴をまず概観してみます。円グラフ、折れ線グラフ、棒グラフ、散布図の4つです。
それぞれのグラフは、何を表現したいかに応じて使い分けることになりますが、いざ表を目の前にしてグラフを作ろうとしたときに、どのグラフを使うのがベストなのかがすぐには判断がつきにくいこともあります。判断のポイントとなるのは、「系列数」「質的視点」「量的視点」という3つの見方です。
チェックポイント1
系列数(数値の列が1つか、複数か?)
まずはベースとなる表の「系列数」を見ます。系列数という言葉はあまり耳慣れない言葉ですが、わかりやすくいうと、グラフ作成のベースとなる表において、数値が1列なのか複数列あるのかということで考えてみればいいでしょう。数値が1列の場合を、「系列数が1つ」といいます。系列数が1つの場合、使うグラフは円グラフか棒グラフ、折れ線グラフに絞り込まれます。以下に系列数が1つの表を3つ挙げます。
2005年 | 2006年 | 2007年 | 2008年 | |
---|---|---|---|---|
ページビュー数 | 100 | 110 | 125 | 145 |
インプレッションのシェア | |
---|---|
バナーA | 54.0% |
バナーB | 28.5% |
バナーC | 17.5% |
クリック数 | |
---|---|
バナーA | 1.5% |
バナーB | 2.4% |
バナーC | 0.9% |
チェックポイント2
量的視点(数値の合計は100%か?)
系列数が1つで、かつ売上や販売数のシェアのような、合計して100%になるような場合は、円グラフを使います。上の3つの表のうち、表Bの数値の合計が100%になりますので、表Bは円グラフにするのが最も適しています。ちなみに、表Aの数値の合計は100を超えますし、表Cの数値の合計は100%に及ばないのがひと目でわかります。
インプレッションのシェア | |
---|---|
バナーA | 54.0% |
バナーB | 28.5% |
バナーC | 17.5% |
チェックポイント3
質的視点(表のタイトル行は時系列か?)
次に表のタイトル行が年や月、曜日、時間などの時系列になっているとき、たとえば毎年の売上高の推移を見るような表の場合は、折れ線グラフを使って時系列を追っていけるようにします。上の3つの表では表Aがこれに当たります。
2005年 | 2006年 | 2007年 | 2008年 | |
---|---|---|---|---|
ページビュー数 | 100 | 110 | 125 | 145 |
表のタイトルが時系列でないときは、たとえば、商品別の売上を横並びで見せる場合は、棒グラフ(縦でも横でも)を使います。結果的に表Cは棒グラフにするのが適切ということになります。
クリック数 | |
---|---|
バナーA | 1.5% |
バナーB | 2.4% |
バナーC | 0.9% |
系列数が2つ以上の場合
系列数が2つ以上ある場合も、基本的には系列数が1つの場合と同じチェック方法が使えます。グラフのもとになる表とグラフの例示はしませんが、今度はグラフ化する前のデータが複数行(あるいは列)の数字の表になっていますので、たとえば、時系列で売上と利益の推移を見る場合は、2本線の折れ線グラフになりますし、またある調査で複数回答可(すなわち、パーセンテージの合計が100%にならない場合)の質問の男女別の回答を示すような場合には、多くの棒が立っている比較棒グラフを使います。
少し毛色の異なるグラフが、4つ目の散布図というものです。このグラフは系列数が複数あるデータで、項目間あるいは指標間の関係性を見る場合に使います。具体的には、下図をご覧ください。
これはある媒体のバナー広告のインプレッション数とリーチ(累積到達率)を広告素材ごとにプロットしたグラフです。1つの点がそれぞれ1つの広告素材のインプレッション数とリーチを表しています。たとえば、一番右上にある点として表現された広告素材だと、リーチ数が約320万人、インプレッション数が約180,000,000回ということになります。
一般的には、リーチが多ければインプレッションもそれに比例して大きくなるので、グラフ上の点はほぼ直線状に並ぶのですが、ときどき赤丸で囲んだ点のように、直線から大きく外れる点が出てくることがあります。今回の例では、この点はリーチは比較的高いのにインプレッション数が少ないという特性を持った広告メニューとして浮き上がってきます。原因は断定できませんが、広告メニューを掲載したスペースが閲覧頻度の低いコンテンツである可能性が考えられます。このように複数の指標間の関係性や特徴を知る場合に、散布図が有効になります。
まとめ
どのグラフを使うのがベストなのかを簡単に判断できるように、今回説明したチェックポイントをチャートにしてみました。
また、下表は今回説明した系列数、質的視点、量的視点という3つの見方で、4つのグラフを整理したものです。○がついているものが、その目的で利用するのにふさわしいグラフです。△印は場合によってはこちらを使ってもよいと考えられるものです。
系列数 | 質的視点 | 量的視点 | グラフ | |||
---|---|---|---|---|---|---|
円 | 折れ線 | 棒 | 散布図 | |||
1つ | 項目や指標間の比較 | 絶対数 | △ | ○ | ||
割合% | ○ | |||||
時系列変化 | 絶対数/割合 | ○ | ||||
2つ以上 | 項目や指標間の比較 | 絶対値 | △ | ○ | ||
時系列変化 | 絶対数/割合 | ○ | ||||
項目や指標間の関係性 | 回帰線相関係数 | ○ |
上表で縦横どちらから見ても1つしか○がついていない円グラフと散布図は、目的がはっきりしていてグラフの選択に迷うことが少ないともいえます。いっぽう、折れ線グラフは○や△が多くついていることから、比較的使う頻度は高いものの、間違いや工夫の余地があるともいえます。
今回は主要4グラフの概要をお話ししました。次回からはそれぞれのグラフについての利用方法と正しい使い方を解説していきます。次回は円グラフとその派生形をいくつかを取り上げる予定です。
ソーシャルもやってます!