グラフ仕事人六道数人~陥りやすいデータ分析の誤りと効率的なグラフの利用方法

第3回 棒グラフの甘い罠 その3:解説編~折れ線グラフは賢者の選択

この記事を読むのに必要な時間:およそ 2 分

様也は,数人の作ったグラフと自分のグラフ,それに実数のグラフを並べてみた。あきらかに違う。というか,自分の作ったものだけが違う傾向を示してる。これはいかなる異常事態と掌に汗がにじむ。真っ先に思いついたのは,Excelのバグだが,そんなことはありえない。

画像 画像 画像

様也はあわてて計算式を確認するが,構成比の計算に間違いはないし,グラフの指定も元データの参照先も間違っていない。なぜこんなに違っているのだ? 様也は瞬きもせずにExcelを凝視する。目は充血し,血の涙が垂れて,テーブルに血だまりができる。

  • 「あーあー,またきれいにしなきゃ」

一転してサングラスで森田童子を歌っていた美希がため息をつく。特異体質の様也は感情が昂る血の涙を流す。幼いころは,⁠マリア様かよ」とさんざんいじめられ,学園祭の演し物にまでされた。なにもない教室の真ん中に,天井から吊され,⁠叩くと血の涙を流します。1回100円」という札を首から提げさせられたのだ。

  • 「すまん。つい集中してしまった」

様也があわてて顔をこすると,顔中が血まみれになり,猟奇殺人犯のごとき様相を呈する。

  • 「ビーフシチューでなくてよかった」

と数人が苦笑する。

  • 「わかった! 構成比の数字が違うんだ。でもなんでだ?」

ユリイカ(スプラトゥーンの百合カップルを指すのではない)と様也が叫ぶ。

  • 「お父さん,ようやく気がついたようですね。正解まで,あとちょっとです」

表2 数人が作った構成比

クリック数1週2週3週4週合計
特集54.15%21.27%29.23%51.14%34.46%
イベント23.81%61.10%51.83%29.23%46.41%
ニュース8.17%2.49%4.03%6.09%4.55%
連続インタビュー4.90%1.56%2.53%4.04%2.85%
コラム4.20%1.36%2.02%3.65%2.44%
編集後記4.76%12.22%10.37%5.85%9.28%
合計100.00%100.00%100.00%100.00%100.00%

表3 様也が作った構成比

クリック数1週2週3週4週合計
特集27.85%22.57%24.37%25.21%100.00%
イベント9.09%48.13%32.09%10.70%100.00%
ニュース31.82%20.00%25.45%22.73%100.00%
連続インタビュー30.43%20.00%25.51%24.06%100.00%
コラム30.51%20.34%23.73%25.42%100.00%
編集後記9.09%48.13%32.09%10.70%100.00%
合計17.72%36.56%28.73%16.99%100.00%

様也がまた画面を凝視する。

  • 「やめてよ。また血の涙が落ちるじゃない。どうせわかんないんだから,さっさと数人から正解を教えてあげなさい」

妻であり,母親である美希はそう言い,⁠さよならぼくのともだち』を口ずさむ。舞い降りた昭和の歌姫のささやくように広がる絶望とノスタルジックな歌詞が中年娘を支配している。

  • 「いいですか?」

数人は大きくため息をつき,様也の横に移動する。

  • 「この場合,構成比の計算方法は,主には3つです。母数に全体の合計24,174を用いたもの,週別の小計(4,284,8,838,6,946,4,106)を用いたもの,記事別の小計(8,330,11,220,1,100,690,590,2,244)を用いたものです。週ごとの変化を見たいわけですから,週別の小計を母数に用います。お父さんは,ここで間違えた。あなたは記事別の小計を母数に用いました」

数人の指摘に,様也はあっと声をあげる。

  • 「記事別小計を母数にした場合のグラフはこうなります。記事別週別グラフです」

画像

  • 「しかし,それなのにあなたはグラフ化にあたって,週別記事別グラフを作ってしまった。2つ目の過ちです。その結果,かたちだけは僕のグラフと同じなので比較できるようになりましたが,数値は記事別小計を母数した構成比なのでまったくもってナンセンスなグラフになり,恥の上塗りをするはめになったわけです」

数人の説明に様也は血の涙を流して己の失敗を悔やんだ。

  • 「世話が焼けるったらありゃしない」

美希が様也に,ティッシュペーパーを手渡す。受け取った様也が顔を拭くとたちまちティッシュも顔も血だらけになる。さながらスプラッタホラーの一場面のようだ。

  • 「最後にもうひとつ。あなたの最大の失敗は,棒グラフを使ったことです。この3つのグラフを比べてご覧なさい」

画像

画像 画像

  • 「第2週と第3週ではイベントページへのアクセスが最も多いですが,第1週と第4週では特集ページへのアクセスが多いと僕は申し上げました。グラフ2の棒グラフからそれを読み取るのは難しくはないが,ひとめでわかるというほどではありません。しかし,グラフ5の折れ線グラフからならそのことがいやというほどわかりやすく示されています。さらには同じ構成比を記事別週別にしたグラフ6を見れば,特集とイベント以外の記事に限らず,全体的に第1週+第4週と第2週+第3週は似たような傾向を示していることがわかります。アクセス傾向から2つのグループに分れています。線のカーブが似ていることからすぐにわかります」
  • 「た,確かにそうだね」

様也は呆然とグラフをながめる。

  • 「常々僕が主張しているように,折れ線グラフは最強のグラフなのです。人は時に棒グラフや円グラフを使いたくなりますが,ほとんどの場合,それは愚かな過ちにつながります」

数人はそこまで一気に話すと,くるりと背を向けて食卓を離れた。

  • 「折れ線グラフは賢者の選択。棒グラフは甘い罠。頭に刻みつけておいてください」

ギリシャ神話のアドニスのごとき美しい横顔に,冷たいデータ神の笑みを浮かべ,数人は去って行った。

残された様也は血の涙を流しながら,必死に息子のアドバイスをメモするのだった。

著者プロフィール

原隆志(はらたかし)

シンクタンクで7年間市場および新製品開発などの調査研究に従事した後に独立し,大手IT企業のコンピュータ・ネットワーク市場調査,新製品開発調査およびコンサルティングを行う。その後,インターネットプロバイダなどのネット関連企業の役員を歴任。『インディペンデントリサーチャー養成講座』など多数の調査分析セミナーの講師を務めた。2015年9月刊『直感でわかるデータ分析』(技術評論社)

コメント

コメントの記入