12 years 9ヶ月 ago
定期メルマガの巻頭コラムのアーカイブです。メルマガの登録はこちら↓からどうぞ。
■ %同志を比較するのに%を使うとミスリードしやすい
「精神疾患のある成人の喫煙率、正常な人を70%上回る」
http://jp.wsj.com/article/SB10001424127887324406204578288874185505596.html
こういうタイトルの記事があったのですが、このタイトルに直感的に違和感がしました。これを名づけると「%のトリック」とでもいいましょうか。100%が実際の最高値ではありませんが、100%が最大というイメージがあるため、70%がもの凄く大きな数字に見える効果があります。
実際の記事をみると、「...精神的な疾患を抱える成人のうち、喫煙者は3分の1強の36%に達しており、疾患のない成人の喫煙率である21%を70%以上上回っている...」ということで、36%÷21%=1.71で、70%上回るというタイトルになっている訳です。
例えば癌の発病率が5倍とか言えば「なるほど」となりますが、喫煙率が1.7倍というのではあまり驚かないですよね。もっと大きな差として表現したいというのが記事を書いた人の心理だと読み取りました。
記事タイトルのような短い文章で正しく伝えるのは確かに難しいのですが、%と%の比較をする場合は、何%ポイント差が出たというのがミスリードが少なく、さらにそれぞれの絶対値も言わないと、その比較の相対的な程度も読み取れません。
そのため文中の方の表現は、「...精神的な疾患を抱える成人のうち喫煙者は36%、疾患のない成人の喫煙率は21%で15%ポイントの差がある...」というのが最も望ましい表現法だと思っています。
よくあるのが、この場合に%同志の差で「15%の差」という場合もあります。「15%ポイントの差」ではないところがミソです。大抵大げさに表現したいことが多いので、この記事のように「70%の差」と表現するのですが。どうしても比率で言いたいなら、××率はAとBで1.7倍の違いがあったと言って欲しいところです。
当たり前ですが、情報量を減らすことで失うものがあるのです。私が好きな平均のトリックなんかも本質は同じで、代表値で語ることで、多くの情報を捨てるということと表裏一体の関係なのだということです。
この事例では大きな差を感じなかったかもしれませんが、数字は相対的に絶対的に、あるいは提示する順番、分母分子を逆にするといったいろいろな提示の仕方によって大きく印象が変わることがあることを知っておいて欲しいと思います。
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 9ヶ月 ago
定期メルマガの巻頭コラムのアーカイブです。メルマガの登録はこちら↓からどうぞ。
■ 数字を扱うインフォグラフィックに対する願い
何度かソーシャルメディア上でインフォグラフィックが嫌いといったようなことを発言したことがあるのですが、ここで少しまとめてみました。
ウィキペディアで「インフォグラフィック」の項目を見ると、インフォグラフィックの素材は「情報」「データ」「知識」とあり、ここで話をするのは、あくまで「データ」つまり数字が含まれる情報をインフォグラフィックで表現する時に範囲を限定させて頂きます。
インフォグラフィックは伝えたい情報を、デザインを中心に利用して伝えるのが目的だと思います。伝え方は基本的にテキストをなるべく少なくして、シンボルなどを使ったデザインで見せるものだとは理解しています。
ただ、データを見せるということでは、様々な調査データの発表と同じような要素を最低限見せて、ミスリードしないようにして欲しいと思います。そのようなことから考えると下記のような要素や条件が必要ではないかと考えています。
・情報ソース元を明記する
・違う元データ群を混ぜて、自分の主張に合ったデータだけを選択して、一つのストーリーにしない
・何を伝えたいのかが容易にわかる(奇をてらったデザインにしない)
・タイトルをつける(何を言いたいのかを一目でわかるようにする)
・数値に対応する凡例が解るようにする
・グラフやチャートに実際の数値(%や絶対値)を入れる
・アンケートなどの場合は回答数などの母数を入れる
・複数のグラフやチャートを並べる場合は見る順番がわかり易いこと
・グラフのトリックを使わない(スケール違いや立体化による誇張など)
残念ながら、私の目に触れるインフォグラフィックがたまたまそうなのだと信じたいですが、最近目にする多くが、何を言いたいのか、何が書いてあるのかすらわからないものがあります。極端に言えば、全体で一つの絵画にしか見えないのです。多くの情報を盛り込み過ぎのも多く見かけます。
難しい要求をしているとは思いません。グラフや表を作成するときの基本的項目で最低限押さえて欲しいことを挙げているだけです。例えば凡例などはテキストではなくて、わかり易いアイコンなどでもよいと思うわけです。それが一目瞭然のピクトグラムであれば、伝え方の表現として悪くはないです。
ある制限・制約の中でどれだけ素晴らしいデザインで情報を伝えられるかということだと思うのですが、そこには何でもありの自由が与えられている訳ではなく、「わかり易く伝える」から逸脱して欲しくないと思います。
noreply@blogger.com (hiromi ibukuro)
12 years 10ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 10ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
12 years 10ヶ月 ago
noreply@blogger.com (hiromi ibukuro)
ウェブアナリスト 宏美のブログ。WebAnalyticsの3Cデータと関連情報を提供。一つはcompetitor、市場マクロデータや競合データ。一つはcompany、自社のアクセス解析データ。最後はcustomer、ユーザー行動データ。数値の一人歩きをさせたくないので、詳しくは原典と各調査方法を確認のこと。Unknownnoreply@blogger.comBlogger9007125
Insight for WebAnalytics フィード を購読