データドリブンの極意
Tableauブートキャンプで学ぶデータを「読む」「語る」

[表紙]データドリブンの極意 〜Tableauブートキャンプで学ぶデータを「読む」「語る」力

紙版発売
電子版発売

A5判/368ページ

定価2,992円(本体2,720円+税10%)

ISBN 978-4-297-12209-6

電子版

→学校・法人一括購入ご検討の皆様へ

書籍の概要

この本の概要

「もっとデータを活用して業績アップ」
「データドリブンで事業をもっと大きく」

このようにデータが重要といわれる現代では,一人一人がデータとの向き合い方を会得し,自分自身の意思と判断力を持つために「データリテラシー」を身に付けることが必要です。
データリテラシーとは,データ活用の意味から理解し,人間がデータとどう向き合うのかという視点で,どのような役割を担う人にとっても今必要なデータにまつわる知識です。データベースやSQL,難しいシステム,あるいはデータを可視化するデザインの話だけではありません。
本書は,著者が創設した「Tableauブートキャンプ」における師と弟子の対話を元に,8年間かけて会得したノウハウ・考え方をまとめあげた本です。

「データとはなにか」
「データを使ってどのように改善するのか」
「データを可視化して人々を動かすにはどうすればよいか」

これらの観点から,技術的な専門知識だけではない,データ活用の本質を考えます。

著者の一言

本書はすべての人が持つべき基礎的なデータリテラシーについて記した本です。
データが重要と言われ,久しい世の中になりました。しかし,私たちはなぜデータを資源と呼ぶようになったのでしょうか。データの量が増えたから? データの種類が増えたから? それは結果に過ぎません。
ビジネスにおいては,対面する顧客が目の前に物理的に存在しているケースは驚くほど少なくなりました。Web会議,Eコマースサイトの買い物客,IoTのデータなど,目の前にいるものを相手取ることは激減しています。さらに,今このコロナ禍という未曾有の事態により,自分と相手のいる場所が異なるケースはますます増えていくことも明確になりました。
では,判断するべき対象が目の前からほとんど消え失せている今,私たちはいったい何をもとに判断を下すのか? それがまさしくデータなのです。
データには,過去から現在のさまざまな履歴が記録されています。自分とは遠く離れた場所のことも記録されています。データを見ることで,時空間を超えて判断するべき対象の状態を,同時かつ即時に理解できるのです。
使えるのであれば使うというのが人の性でしょう。みなさんが意図しているかどうかに関わらず,みなさんと周囲の方々は生きているだけでデータを生成し,そのデータは数多の組織によって収集されています。そして,すでに世界はデータを通して理解され,次のアクションが導き出されています。
そう,すでに使える人はデータを使っているのです。
ただし,残念ながらそれはすべての人ではありません。このまま何もしなければ,ごく一部のデータを使いこなせる人たちにすべての意思決定を委ねる格差社会が到来するでしょう。しかし,それはあまりにも寂しい世界です。私は,すべての人がデータによる恩恵を受け,多様性があふれるコラボレーションによる発展的な世界へ向かうためにこの本を執筆しました。
本書で語るデータリテラシーというのは,リテラシー(読み書き能力)というまさに言葉の知識です。すなわち,データを通して世界を理解する新しい言葉の使い方です。
データリテラシーというと「SQLが書けるようになることかな?」「難しいシステムの話が出てくるかな?」と心配されるかもしれません。しかし,本書はいわゆる技術書とは異なります。技術的な話よりは,データ活用の本質から理解し,あくまでもすべての人がデータとどう向き合うのかという視点で,どんな背景を持つ方でも,どのような役割を担う方にとっても今必要なデータにまつわる知識をまとめました。
私が本書で記すことは,これまで私が出会ったTableauやSnowflakeというデータを取り巻くプロダクト,そしてそれらを中心に集まったコミュニティで出会った人々から8年近くかかって会得したものです。私自身もだれかの経験を自分に蓄積することで8年以上の知識を継承してきた自覚があります。一方でデータの重要性が加速度的に増す中,これからデータについて勉強したいと思う人が8年かけて1から勉強するのでは,どう考えても間に合わないでしょう。そこで,この本は私の8年間のうち,すべての人が知っておくべきデータリテラシーの部分を圧縮してまとめました。
この本によって多くの人が遠回りせずにデータリテラシーを会得し,データがあふれるこの世界の中で,自分の意思を持ち歩み出せるようになることを期待しています。
この本は,かつて私が教わったたくさんの師との対話と,私自身が師として愛する弟子たちに伝えた対話が元になっています。そのため,これまでに出会ったすべての方々へ敬意を表し,「Apprentice(弟子)」と「Master(師)」の対話で進んでいきます。この本の読むみなさんは,ぜひ自分も1人のApprenticeとなってデータリテラシーを学ぶ旅に出発してください。その旅は険しく,長いようでいて,同時に最高に楽しくあっという間に過ぎ去ってしまう日々になることでしょう。
願わくは,この本がデータの海に溺れ,迷う人の道標となりますように。
(本書「はじめに」より抜粋)

この書籍に関連する記事があります!

データリテラシーを身につけよう
データが重要だと言われて久しい現代では,技術の進化によりデータの増加量がどんどん加速してきています。

本書のサンプル

本書の一部ページを,PDFで確認することができます。

本書の紙面イメージは次のとおりです。画像をクリックすることで拡大して確認することができます。

サンプル画像1

サンプル画像2

サンプル画像3

サンプル画像4

目次

  • はじめに

DAY0 データドリブン文化のはじまり

0-1 プロローグ

  • データを扱うのにITの専門家である必要はない
  • データリテラシーを1か月で学ぶ

0-2 なぜデータドリブンを目指すのか

  • データの本質を考える
  • データを見ることが世界を知ることになる
  • 八百屋さんのデータ活用例
  • データを使ってマスマーケティングから脱却する
  • データドリブンと共存する「経験と勘2.0」
  • データで経験を拡張する

0-3 すべての人が持つべき「データリテラシー」

  • リテラシーと文化のつながり
  • データを「読む」「書く」力が必要になる
  • データリテラシーの4つの必須要件
  • データリテラシーを学んで,広げる

DAY1 データストーリーテリング

1-1 なぜストーリーが必要なのか

  • ストーリーで理解を深める
  • ストーリーの力を体感する
  • ストーリーを使う2つの意義
  • 思考のフローのきっかけを生み出す

1-2 インプットとアウトプットの連鎖で思考する

  • インプットとアウトプットを同時におこなう
  • アウトプットをかんたんにする
  • データを扱う道具
  • 良い道具は「身体の一部」となる

1-3 ストーリーでデータを分析する

  • デモンストレーションで思考のフローを学ぶ
  • Eコマースの売上データ分析デモ
  • 必要なこと以外をあえて削ぎ落とす
  • デモでは操作説明をしない
  • デモで意識するべき4つのポイント
  • 見る人を飽きさせない3つの工夫

1-4 ストーリーテリングの枠組みを理解する

  • 構造化データとスプレッドシート
  • 列の値を2つに分類する――メジャーとディメンション
  • ディメンションの4種の属性
  • ディメンションの階層を確認する
  • データ分析の2つの方向性
  • ディメンションが不十分なデータの問題点
  • 分析するデータの信頼性
  • 存在していないデータに思考をめぐらせる
  • 5W1Hの「4W」でストーリーを紡ぐ
  • 見慣れない専門用語を学ぶ意義

1-5 他人のアクションを導く強いストーリーを作る

  • データストーリーテリングのゴール
  • 美しいグラフだけではアクションを呼び起こせない
  • 起承転結でストーリーを強くする
  • 身に着けるということ

DAY2 ビジュアル分析

2-1 ビジュアルでデータを理解する

  • グラフは本当に「あいまい」なデータなのか
  • 視覚を駆使してデータを理解する
  • 「見やすい」の本質を考える
  • ビジュアルを正しく使う必要性
  • すべての人が理解できる表現を選ぶ
  • データをビジュアル化する意義

2-2 ビジュアル分析のサイクルを理解する

  • データ分析で何を解決するのか定義する(Task)
  • Taskに沿ってサイクルをすばやく回す
  • Taskを解決する行動を常に意識する(Act/Share)
  • Taskが見当外れだった場合も成果になる

2-3 思考のフローを生み出す脳のしくみを押さえる

  • 記憶を構成する3つの要素
  • アウトプットとしてデータをビジュアル化する
  • 感覚記憶の力を最大限に使う
  • 感覚記憶を動かす10種の視覚属性(Preattentive Attribute)
  • Preattentive Attributeの強さの違い
  • ①色vs形状――見え方の違い
  • ②サイズvs長さ――見え方の違い
  • ③位置vs色――見え方の違い
  • 最適な視覚属性は常に変化する
  • 一般的な知識としてビジュアルを土台にする

2-4 データに合わせて視覚属性を使いこなす

  • データには3つのタイプがある
  • Preattentive Attributeとデータのタイプの相性
  • コンテキストを利用して視覚属性を重ねる
  • データ数が多いときはビジュアル選択に気をつける
  • 視覚属性のパターン増加に注意する
  • コンテキストを持たない記号的な視覚属性に注意する
  • 無意味な色分けに気をつける
  • 色を有効に使う
  • 背景色とビジュアルの相性を考える
  • ビジュアルの背景色をそろえる
  • 色覚多様性に配慮する
  • 場所は必ずしも地図でなくていい
  • 比較で伝えたいことを強化する

2-5 ビジュアルの構成をまとめあげる

  • 「探索型」か「説明型」かビジュアルのタイプを見極める
  • タイトルと色のポイント
  • 相手の「ほしいもの」ではなく「したいこと」をベースにする
  • ビジュアル化の表現は無限

DAY3 分析プラットフォーム

3-1 データを使える環境を共有する

  • データドリブン文化に必要な3つの要素
  • 分析後のデータ共有の課題
  • すべてのデータと人を同じ土台に乗せる
  • データベースと分析プラットフォームは別物
  • 理想的な分析プラットフォーム
  • データカタログを用意する
  • 分析プラットフォームの上での行動を明確にする
  • 分析プラットフォームに必要な要件を押さえる
  • 分析プラットフォームを活用する

3-2 データの自由化と保護のバランス

  • 昔と今のプラットフォームの変化
  • データを保護するだけではかえって危険になる
  • データを守りながら,データを開放する
  • 分析プラットフォームはウォーターフォールよりアジャイル
  • 文化醸成の最初のステップを進めるパイロット部門を選ぶ
  • データドリブン文化を全社展開する
  • 文化醸成は終わりのない旅路

3-3 データを開放して人々を動かす活用例

  • ゴール達成のためにハンズオンセミナーを改善した例
  • 周囲を説得するデータを分析プラットフォームに乗せる
  • データは人を動かすことができる
  • 手作業が多いデータは廃れてしまう
  • データは見られるほど美しくなる
  • 道具と共に進化する分析プラットフォーム
  • 分析プラットフォームが支える3つの役割

3-4 データを見るだけの人は存在しない

  • 3つの役割すべての人を分析プラットフォームに乗せる
  • 3つの役割が担うビジュアル分析のパート
  • データ原始時代から脱却し,データ文明時代へ

DAY4 データとはなにか

4-1 データの語源と歴史を振り返る

  • データ(data)の語源から意味を考える
  • 「データ」と「情報」の区別
  • 与えられたものを「記録」したものがデータとなる
  • 人類最古のデータとは
  • 紙媒体によるデータの4つの問題点
  • コンピューターとデータの進化
  • データ飽和状態の現代

4-2 データを管理・活用するシステムのしくみ

  • 入力を正確に早くおこなうために生まれたデータ
  • 正規化で入力するデータ量を極限まで減らす
  • 基幹系システムとデータの活用
  • データを情報にするための情報系システム
  • 情報系システムがクリアするべきポイント
  • 巨大化するデータを保管するためのデータウェアハウス(DWH)
  • 膨大なデータを集計・視覚化するBIツール
  • 基幹系からデータを変換して取り込むETL
  • ETL/DWH/BIの各ツールは明確に分けられるものではない
  • データの入力値を制御する
  • DWHのパフォーマンスを上げるデータマートとキューブ
  • データマートとキューブの処理の限界
  • 巨大なデータを直接処理するためのインメモリデータベース
  • 列指向と行指向
  • カーディナリティ

4-3 現代の情報系システムの進化

  • データの保管・変換手法の変化
  • 増え続けるさまざまなデータの種類に対応する
  • データの利用目的に合わせて保管場所を変える
  • すべてのデータ処理を同時におこなう試み
  • データ分析に最適なシステムを選択する

4-4 目の前のデータの正しい知識を身につける

  • データの価値を見極める3つの指標
  • 分析しやすいデータの形
  • あり得る値と欠落した値に想いを馳せる
  • データの粒度を見極め,詳細レベルを操る

DAY5 データドリブン文化をさらに広げるために

■5-1 データとテクノロジーの進化を学び続ける

■5-2 データドリブンの仲間を増やす

  • 必要な知識は組織によって異なる
  • 真の「データドリブン」とは
  • 多くの人に基本知識を伝えて「学ぶきっかけ」にする
  • 最低限のデータリテラシーとはどこまでか
  • 人の心を揺り動かす「強い言葉」から逃げない
  • おわりに
  • さくいん
  • 著者プロフィール

著者プロフィール

Master KT(マスター ケイティー)

田中香織(たなかかおり)。
Snowflakeプロダクトマーケティングマネージャー。三菱グループの大手SIer ITフロンティアでBI、ETL等情報系システムのプロジェクトマネージャーやプロダクトトレーナーなどを歴任。2015年からビジュアル分析ツールTableauでプリセールスコンサルタントとして年間300を超える顧客へ提案支援やデモンストレーションを行った。2020年6月よりスノーフレイクでセールスエンジニアとして活動したのち、2021年4月から現職。Snowflake、Tableau共に公式上級技術者認定資格を保持。
プロダクトが掲げるコンセプトやメッセージを人々に伝えるエヴァンジェリストとして活動しながら、プロダクトを愛する人々の集まりであるユーザーコミュニティを作り育んできた経歴を持つ。400人を超える卒業生を輩出するデータドリブン文化醸成を目指す人々のためのDATA Saber認定制度の創設者。自身のYouTube「KTChannel」でデータ活用の在り方や技術について配信中。
ちなみに、KTのTはTanakaのTではなくTableauのT。

Twitter:@DATA_Saber
YouTube:https://www.youtube.com/c/DATASaber/
DATA Saber認定制度:https://datasaber.world