データをざくざく処理するためのグラフの読み方、使い方

棒グラフの用途に合った書き方 グラフの特徴や使い方のルールも解説!

棒グラフは使う場面に応じて、集合棒グラフ、積み上げ式グラフ、ヒストグラムなどの表し方があります。それぞれの特徴、作成時のルール、デメリットを解説していきます。情報を比較したり、変化を観測するために、視覚的に見やすくすることは非常に大切なことです。最適なグラフを選択し、作成することで説得力のある資料作りにも役立ちます。
データをざくざく処理するためのグラフの読み方、使い方

前回は円グラフについて説明しました。今回は棒グラフを取り上げます。棒グラフには、系列が一つの場合にも、普通の棒グラフと度数分布図(ヒストグラム)という2種類のグラフがあります。

普通の棒グラフは数字の大きい順に項目を並べる

普通の棒グラフは、左(もしくは上)から数字の大きい順に項目を並べますが、項目の並び方に意味がある場合は、必ずしもそうする必要はありません。例えば下の図1のようなケースです。

画像:棒グラフ
図1:棒グラフ(クリエイティブ別のクリック率)

これはバナーA、B、Cの順にバナーのサイズ(面積)が大きい順なので、ABCの序列をそのままにすることによって、「バナーの面積が大きいからといって、クリック率が高いという訳ではない」という別の知見が発見できるからです。しかしときどき何も考えずにアンケート項目の順などがそのまま並んでいるグラフもよく見ますので、数字の大きい順あるいは、意味のある順番で項目は並び変えましょう。

ヒストグラム(度数分布図)は階級のまとめ方に注意

一方、ヒストグラムは縦軸に度数(データの個数)、横軸に階級をとったグラフで、データの分布状況を把握できるグラフです。階級とは、身長のような連続型変数であれば150cm以上155cm未満など適切な小区間に分割したものです。都道府県別のようなカテゴリー分けもあります。

ヒストグラムは、連続的に変化する値や意味合いのある序列をカテゴリー分類しているので、数字の大きい順に並び替えることはあまりないでしょう。年齢の低い方から高い順、年収の低い方から高い順、北から順番の都道府県などで、左から右へ並べます。

画像:棒グラフ
図2:ヒストグラム(クリック率別の媒体数)

またヒストグラムを見る際の注意点は、カテゴリーのまとめ方に一貫性があるかどうかという点がポイントです。図2では0.5%刻みにグルーピングしているので、最後の4.0%以上だけを注意すれば大丈夫です。ここの内訳をもう少し尋ねることで、より正確な分布が把握できます。

どういった場合に注意が必要かということですが、途中のカテゴリーにおける数値の間隔が変わっている場合です。例えば年齢区分で20歳から49歳までは5歳刻みの6カテゴリーがあり、その他の年代は10歳区切りといったことがあります。そのまま同じボリューム感でグラフを見てはいけない訳で、グラフの作成者が意図的に作図したわけではなくても、また注記がなくても、ヒストグラムを見る場合に、まっさきに注意しなければならないポイントになります。

また年収の分布などは青天井ですから、上の方のカテゴリーはかなり大きくまとめられている場合がありますので、一番下と一番上のカテゴリー、途中における間隔の変化という3つの点に気をつけましょう。

時系列でも結構使う棒グラフ

さて第1回目で、時系列の場合の基本は折れ線グラフといいましたが、実際に棒グラフも多用されておりますし、問題はありません。時系列で全体とその内訳を見せたい場合は、積み上げ棒グラフを使うしか手はないので、こちらを使うのは当然です。下図の例は、mixiのページビュー数の時系列推移ですが、最近は携帯電話からのアクセスが増えていて、パソコンからのアクセスは減少し、全体としては緩やかに増加しているという3つの情報を一度に盛り込んでいます。

画像:積み上げ棒グラフ
図3:積み上げ棒グラフ(mixiのページビュー数 mixiの決算資料から作図)

積み上げ棒グラフでなくても時系列データで比較棒グラフは多用されます。以下に売上高と利益の推移を示したグラフを2種類用意しましたが、いかがでしょうか。どちらも違和感がありませんし、むしろボリューム感があるためか棒グラフの方が好まれて使われています。

画像:折れ線グラフ
図4:折れ線グラフ(売上高と利益の推移)
画像:集合棒グラフ
図5:集合棒グラフ(売上高と利益の推移)

ただし系列が3つ以上になると見づらくなってくるので、棒グラフと折れ線の複合グラフや、折れ線グラフが使われることが多くなります。

100%積み上げ棒グラフの弱点

さてここで質問です。下の棒グラフで気を付けなければならないデータがあります。それはどの部分でしょうか。

画像:100%積み上げ棒グラフ
図6:100%積み上げ棒グラフ(年齢別関心度)

ここはグラフそのものの見方というより、データの見方で注意しなければならない点です。これはアンケート調査において関心度を年齢区分別にクロス集計してグラフにしたものですが、男性60歳以上の比率が、10.0、25.0、25.0、25.0、15.0とやけに切りがいいですよね。そうですサンプル数が20と少ないのです。そうするとこのカテゴリーの結果は少し気を付けてみなければなりません。一人の回答が5%と非常に重いので、回答が少し変われば%の変動も大きいということなのです。

親切な調査レポートでは、このようなケースも想定し、必ずN=1500、n=123などと書かれているのにお気づきでしょう。Nは全体の回答者数、nは各カテゴリーの回答者数を示しています。nが小さいと、注釈で「このデータは注意が必要です」ということを記述していることもあります。

集合棒グラフはレーダーチャートや折れ線にした方がいい場合も

さて最後に、系列が2つ以上のオーソドックスな集合棒グラフを解説します。項目にあまり序列の意味はないので、この場合は男性の数字の大きい順に項目が並べてあります。男女という2系列しかないのでまだ見やすいですが、これがもし系列が増えて4つも5つもあると見づらくなります。図4と図5のところでも話をしましたが、系列が3つ以上ある場合は折れ線にしてすっきり見せることで解決します。

画像:集合棒グラフ
図7:集合棒グラフ(サイトでよく目に入る項目)

項目が10個以上あり、横に項目が並んで長いグラフもよく見かけます。これはいたし方ありませんが、できればこの場合も系列はせいぜい3つくらいまでにしましょう。男女や年代別で特徴があれば、図7のようにそこの棒グラフの部分を○で囲んだりするなどして目立たせる工夫も必要でしょう。全体で普通の棒グラフを作図した上で、特徴のない項目は外してもう一つ別の集合棒グラフを作るというのも手です。

当然特徴が際立った部分は、レーダーチャートにするということもよくあります(図8)。ただしレーダーチャートは棒グラフよりもさらに表示スペースに限りがありますので、あまり多くの系列や項目がある場合には、何を伝えたいのか分からないグラフになりがちですので、気を付けましょう。ときどき系列数や項目数が多い巨大なレーダーチャートを目にすることもありますが、ごちゃごちゃしてわかりにくいので、個人的にはあまり見たくないチャートの一つです。

画像:レーダーチャート
図8:レーダーチャート(サイトでよく目に入る項目)

まとめ

棒グラフは系列数が一つの時は、通常の棒グラフとヒストグラムの2種類があります。基本的には通常の棒グラフは大きい順に並べ、ヒストグラムは項目の意味の順に並べましょう。またヒストグラムは項目が数字の場合、分類間隔が同じかどうかに注意してみなければなりません。

また時系列データを棒グラフで作図することも多く行われています。系列が2つまでなら、時系列データを棒グラフにしても問題ありません。系列が多くなった場合は折れ線グラフにするとよいでしょう。また系列数や項目数が少ない場合で、系列間で特徴に違いがはっきりする場合は、レーダーチャートを使うことも考えましょう。

用語集
mixi / クリエイティブ / クリック率 / グラフ / ページビュー / リサーチ / 棒グラフ / 統計 / 調査
この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

AOSSL
「Always on SSL(常時SSL)」の略。 基本的にサイトは非HT ...→用語集へ

連載/特集コーナーから探す

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]