グラフを作る主な目的は傾向の把握と比較
コンピュータが普及し,あらゆるところでデータが蓄積されるようになりました。データ分析は日常業務の一部となりました。大量のデータを短時間で集計し,統計解析するためのツールも整備されました。しかし,必ずしも効率的で実践的な方法が確立されているわけではありません。おそらく確立されることはないでしょう。市場環境の変化に伴って方法も変化してゆくものなのですから。
集計,解析の便利なツールが増えたのはよいことですが,基本的な知識なしにそれらを使うと一見もっともらしいものの誤謬に満ちたレポートが量産されることになりかねません。
データ分析の基本のひとつは,シンプルでわかりやすいグラフです。グラフを作る主な目的は傾向の把握とデータ系列間の比較と言えるでしょう。欲張らずに,この2つに目的を絞り,直感的に傾向を把握し,データ系列間の比較を可能とするグラフを作ることで必要なことがわかります。
実務には汎用的に使える折れ線グラフ
大量のデータを読み取るに当たって,わかりやすく傾向や比較を把握しやすいグラフを選ぶことが重要です。適切で効率的なグラフを覚えておきましょう。
データ分析実務と営業先での説明,プレゼン用では必要なグラフも異なってきます。簡単にまとめると,表1のようになります。
表1 グラフ別特徴一覧表
| データ系列の数 | 特徴 |
1 | 2 | 3 | 4 以上 | 重複 | 重要 項目 | データ 系列間 比較 |
分析実務用 | 折れ線グラフ | ◎ | ◎ | ◎ | ◎ | ◎ | ○ | ◎ |
ヒストグラム | ◎ | × | × | × | × | ○ | × |
パレート図 | ◎ | × | × | × | × | ◎ | × |
散布図 | × | ◎ | × | × | × | ○ | ◎ |
説明用 | 棒グラフ | ◎ | ◎ | ◎ | ◎ | ◎ | ○ | △ |
円グラフ | ◎ | × | × | × | × | ◎ | × |
帯グラフ | ◎ | △ | △ | △ | × | ◎ | △ |
バブルチャート | × | × | ◎ | × | × | ○ | ◎ |
重複:重複する項目(排他的ではない)があった場合でもグラフ化できる。例えば,保有している家電製品をグラフ化する場合,複数の家電製品をひとりが保有しているため,円グラフや帯グラフは適していません。
重要項目:重要な項目,影響度の大きな項目を把握しやすい。
データ系列間比較:複数のデータ系列を比較できる。関係を把握しやすい。
グラフのなかでも,一番注目していただきたいのが折れ線グラフです。折れ線グラフは誰でも知っているグラフであるにも関わらず,その特性を生かして利用している人は稀です。
意外かもしれませんが,分析実務に当たっては汎用的に使える折れ線グラフを中心に用い,その結果を説明に向いた円グラフや棒グラフに加工する方が効率的です。実務において,棒グラフを多用している方も多いと思いますが,「ひとめで読み取ることができる」という点では折れ線グラフの方が優れています。3つ以上のデータ系列の比較において特にそれは顕著です。
図1は,あるサイトの利用者を所得区分別・性別で4つの種類のグラフにしてみたものです。折れ線グラフ,棒グラフ,積み上げ棒グラフ,帯グラフ,どのグラフが傾向を把握しやすいでしょうか?
図1 会員性サイトの所得区分別・性別会員数(棒グラフ,積み上げ棒グラフ,帯グラフ)
年収500万円以下と800万円以上の2つの区分で性別による差が目立っていることがひとめでわかるのは,折れ線グラフだけです。
一般的に,「折れ線グラフは時系列など一定の流れや方向がある場合に使うべき」とされていますが,必ずしもそれにこだわる必要はありません。見やすくわかりやすければいいのです。
折れ線グラフではデータ系列間の比較も容易に行えます。図2は複数のビジネス情報サイト利用者の職業分布を折れ線グラフにしたものです。これを見ると,類似の利用者構成のサイトがはっきりわかります。「類似」というのは似たような折れ線になっているということですが,これは相関関係の可能性を示唆しています。職業など計算不能な属性の相関係数を計算する方法はいくつかありますが,手軽にExcelで計算できません。しかし折れ線グラフを作ることで,おおまかですが相関がありそうかどうかを知ることができます。
図2 ビジネス情報サイト比較 競合サイト職業分布 業界平均付き(折れ線グラフ)
「職業は互いに独立したものだから折れ線グラフのように線でつながず,棒グラフのようにそれぞれ独立しているほうがいい」というのはもっともらしい意見ですが,グラフは本来全体の傾向やデータ系列間の比較を行いたいから作るのであって,独立して個別に比較するだけなら数値だけでもできるのではないでしょうか? 折れ線グラフのように線で結ぶことで全体として把握しやすくなっています。
今回ご紹介したすべてのグラフは,Excelで手軽に作ることができます。ぜひ,ご自身でも試してみてください。
拙著『直感でわかるデータ分析』では,こうした直感的にわかるグラフを用いたデータ分析の方法を下記のような事例をもとに解説し,Excelを用いたグラフの作り方もあわせて紹介しています。
- 売れる要因を探るデータ分析の例(SNSのプロモーション)
- 売れない要因を確認するデータ分析の例(会員性ネットニュースサイト)
- 競合調査の実例(会員性ネットニュースサイト)
- PRのための独自ニュースを作る調査の実例(アンチウイルスソフト会社)
- 満足度調査の実例(ソーシャルゲーム)
- 新サービス需要調査の実例(ECサイトでのプレミア会員制度テストマーケティング)
本書が,みなさんの効率的で有益なデータ分析のお役に立てば幸いです。
また,折れ線グラフの汎用性と優位性については,gihyo.jpに連載中の『グラフ仕事人 六道数人(りくどうかずひと)』の「棒グラフの甘い罠」にも書いております。こちらも合わせてご覧ください。