グラフ仕事人六道数人~陥りやすいデータ分析の誤りと効率的なグラフの利用方法

第12回 思うような結果を手に入れる悪魔のテクニック その3:適切なデータ収集を怠ったためにできるクズ・ビッグ・データ

この記事を読むのに必要な時間:およそ 2 分

本稿では直感でわかるデータ分析⁠2015年9月30日,技術評論社刊)の一部内容を参考にし,データなどを転載しています。

様也は数人の出した問題に頭を抱えている。

数人は肩をすくめると,そそくさと自分の分だけのコーヒーを淹れるために立ち上がった。

  • 「たまにはあたしにもコーヒーちょうだいよ」

母親の美希が横目で数人を見る。今日のTシャツは,映画『ムカデ人間2』の主人公の顔のアップ。食事中に絶対に見たくない。

  • 「あたしにもちょうだい。お兄ちゃんは,あたしより頭も顔もいいんだから,ちょっとは優しくしてよ」

妹の鳳晏も便乗する。

  • 「ふむ。たまには淹れて差し上げましょう」

いつになく数人が家族の意向に素直に従った。

  • 「じゃ,私にも」
  • 「あ,あなたはご自分で淹れてください。クチャラーに人権はありません」

しかし父である様也が手を挙げると,数人は冷たく拒絶した。

ダイニングにかぐわしいコーヒーの香りが満ち,数人が美希と鳳晏の前にカップを置く。

  • 「さて,お父さん,あなたの答えをうかがいましょう。まずはケース1からお願いします」

数人が微笑みとともにコーヒーカップを持ち上げると,薄い桜色の唇がカップに触れた。

  • 「わ,わかった! ケース1の答えは,2だ。他の伝え方もあるから,選択肢が充分じゃない。そうだろ?」

必死の形相で答える様也を横目で眺め,数人はひとくちコーヒーをすする。

  • 「うん,やはりCOE(カップオブエクセレンス)ははずれがない」

数人は目を閉じて満悦の表情を浮かべる。

  • 「コーヒーは満点ですが,あなたの答えは零点です」

数人はまぶたを開くと様也に告げた。

  • 「いいですか? 確かに他の方法もあります。しかし,⁠その他⁠という選択肢が用意されているので,ここを選択することができます。会員情報のように蓄積してゆくものならば,途中で項目を見直して⁠その他⁠の回答が多かったら,後で選択肢を増やすこともできます。選択肢の中に,⁠すませてしまう⁠という価値判断を含む表現があります。つまり,⁠威光暗示効果』表現があることが問題なのです」

数人は罪人を断罪するがごとく冷たく言い放った。様也はしゅんとして,冷めたハンバーグを箸で突く。

  • 「さて,ケース2はいかがです?」

だが,数人は容赦しない。

  • 「う,ううう……ケース2は,問題ないんじゃないかな?」

様也はすねた子供のように投げやりに答えた。数人は,長いため息をつくと,天を仰ぎ「ナーンセンス!」と発する。

  • 「この文章は一見すると,問題なさそうに見えますが,実際は問題だらけです。⁠ご使用中のパソコンやタブレットなど(スマホも含む)のインターネット接続機器⁠という言葉では,利用場所が職場なのか自宅なのか,パソコンもタブレットもスマホもインターネット接続機器も持っていた場合,どれを買った場所を答えればいいのか,インターネット接続機器はどこまでの範囲を指すのか不明です。さらに,家電量販店のネット通販を利用したらどっちになるのか?など選択肢も曖昧なものが多い。つまり,答えは⁠複数の解釈が可能な表現があるため,人によって解釈が分かれてしまう⁠です」

数人は,データの神に申し訳がたちませんよ,とつぶやき,もうひとくちコーヒーをすすった。

様也はがっくり肩を落とす。自分と血のつながっていないことがわかった少年に,ここまで言われるなんて理不尽だという思いが募る。だいたい父親はどこの誰なんだ? 怒りにも似た感情がふつふつとわき上がる。

  • 「お父さん,人生は理不尽ですが,データの神は合理性を尊びます」

胸のうちを見透かしたような数人の言葉に様也はどきりとする。

  • 「さあ,ケース3の答えをうかがいましょう」

そう言うと立ち上がり,様也に近づく。様也は美貌の少年の瞳から目を背けられなくなる。

  • 「こ,こ,答えは,⁠威光暗示効果』があるからだろう? ツイッターで1日30回以上つぶやくなんてツイ廃だ。価値観が含まれてる」

とたんに数人は目を閉じる。

  • 「僕には見えます。お父さんが,地獄の業火に焼かれています。真摯にデータに向き合うのです。そうすれば明らかです」

様也はなにも言えない。家庭はとっくに崩壊しているし,自分の昇進も赤ランプがついたままだ。混迷と混沌の果てになにが待っていると言うのだろう。その時,天啓を受けた。

  • 「わかった。この文章には条件が設定されていない。この手の質問をする場合は,期間を最近1ヵ月あるいは1週間,極端な場合は昨日に限定したり,⁠平均して⁠といった言葉を使ったりして回答しやすくするものだ。それがない」

様也の目に光りが戻ってくる。

  • 「そうです! お父さん,つまり?」
  • 「“複数の解釈が可能な表現があるため,人によって解釈が分かれてしまう”」
  • 「その通りです。頻度を尋ねる質問はとくに人によって,平均,最頻値,中央値,直近1ヵ月のみ,過去から現在までの全期間などイメージが異なります。感覚的に,平均のつもりで最頻値を答える人は少なくありませんしね。できるだけ具体的なイメージを相手に伝える必要があります」

数人が天使の微笑みを浮かべて,様也の肩をたたく。

  • 「なにこれ?」

美希があっけにとられる。知性と美貌を兼ね備えた数人がとりえのない様也を称えるときが来るとは想像していなかった。

  • 「最後にもうひとつ例をお見せしましょう」

数人はそう言うと,コーヒーを飲み干すと2枚のグラフを様也の前に置いた。

  • 「集計結果の見せ方によってもだいぶ受け取り方が変わります。この2つのデータは同じ集計結果をグラフにしたものですが,見た時の印象はだいぶ違います」

グラフ1

グラフ1

グラフ2

グラフ2

  • 「このようにグラフの尺度を変えることで,見る人の印象を好きなように変えられます。気をつけてください」

様也は,何度もグラフを見直し,うなずく。

  • 「最後にお父さん,もう一度,頭にたたき込んでおいてください。会員情報を登録する際に使う文章には最新の注意を払い,できるだけテストしてください。さもないと,せっかくの会員情報がビッグデータという名のクズになってしまいます」

著者プロフィール

原隆志(はらたかし)

シンクタンクで7年間市場および新製品開発などの調査研究に従事した後に独立し,大手IT企業のコンピュータ・ネットワーク市場調査,新製品開発調査およびコンサルティングを行う。その後,インターネットプロバイダなどのネット関連企業の役員を歴任。『インディペンデントリサーチャー養成講座』など多数の調査分析セミナーの講師を務めた。2015年9月刊『直感でわかるデータ分析』(技術評論社)

コメント

コメントの記入