目次
1章 データ分析とは何か
01 データとは何か
- データとは
- 質的データと量的データ
- 構造化データと非構造化データ
- 一次データと二次データ
02 データから価値を引き出す4ステップ~DIKWモデル
- DIKWモデルとは
- DIKWモデルの具体例
03 情報をもとに知識を引き出すデータ分析
- 重要な役割を果たすデータ分析
04 ゴールはあくまでデータを価値に変えること
- データ分析により得られる成果
2章 データ分析の目的と取り組む前の注意点
05 データ分析の目的①現状の正確な把握
- 現状把握はデータ分析の第一歩
06 データ分析の目的②新しい出来事の結果の予測
- 予測結果を活用した的確な意思決定
07 データ分析の目的③物事の関係性の説明
- 未知の課題や関係性を見つけ出し,新しく価値を創出
08 混同を避けるため注意したい関連分野
- データ分析と混同しやすい関連分野
09 データ分析に取り組む前の注意点
- データ分析において注意するケース
3章 データ分析の代表的な手法
10 データの関係性を明らかにする分析手法
- データを構成する特徴量
- 回帰分析
- AI・機械学習による回帰分析
- 主成分分析
- 因子分析
11 データをいくつかのグループに分ける分析手法
- グループ分けは重要な分析手法の1つ
- 分類
- クラスタリング
12 データ間の差を比較する分析手法
- 施策の効果を考える際に役立つ分析
- 統計的仮説検定の注意点
13 データ間の因果関係を明らかにする分析手法
- 相関関係と因果関係
- 統計的因果推論
4章 データ分析を支える周辺技術とツール
14 ETLツール
- ETLツールとは
- ETLツールを利用するメリット
- 主要なETLツール
15 BIツール
- BIツールとは
- BIツールの役割
- 主要なBIツール
16 AutoML
- AutoMLとは
- AutoMLツールの主な機能
- 主要なAutoMLツール
17 データ分析プラットフォーム
- データ分析プラットフォームとは
- データ分析プラットフォームを利用するメリット
- オンプレミス型とクラウド型
- 主要なクラウド型データ分析プラットフォーム
5章 データ分析プロジェクトの企画から準備まで
18 データ分析プロジェクトとは
- データ分析プロジェクトの重要な要素
- データ分析プロジェクトとシステム開発プロジェクトとの違い
19 データ分析プロジェクトの全体像
- 企画→分析→評価の3ステップ
- 分析の企画
- 分析の実施
- 分析結果の評価
20 データ分析プロジェクトチーム体制と役割
- データ分析プロジェクトで必要な役割
- チーム編成時のポイント
21 プロジェクトのゴールと目標の設定
- 似ているようで異なる「ゴール」と「目標」
- ゴール設定のポイント~KGI
- 「目標」設定のポイント~KPI
- 密接に関連するKGIとKPI
22 解決したいビジネス課題と仮説の設定
- 課題と仮説の設定がプロジェクト成功の鍵
- ビジネスの目標達成を阻害している課題の明確化
- データ分析を用いた解決が適しているか確認
- 仮説の設定
23 プロジェクトのスコープ設定
- 曖昧にすべきでないスコープ設定
- スコープ設定のアプローチ
- スコープの変更管理,ステークホルダーとの合意
24 費用の見積もりと費用対効果の評価
- プロジェクトにかかる費用,ビジネス効果の事前確認
- 費用対効果の評価
25 分析方針の検討
- プロジェクト開始時に検討しておくべき要素
- 分析に必要なデータの特定と収集方法などの確認
- データを加工する方針の決定
- 使用する分析手法や可視化手法の選択
- 分析結果の評価指標の決定
- 分析結果のアウトプットイメージの検討
26 データを収集する準備
- 分析に必要なデータと入手手段の確認
- セキュリティ対策と法令遵守
6章 データ分析の実施
27 データの確認
- 生データの確認
- データの全体像の確認
- データの可視化
- 統計量を算出する
- データの全体像を確認した上で,分析に適したデータかどうかを確認
28 データの加工①データの形式を揃える
- データの加工を行う3ステップ
- データの形式を揃える
- 数値データ
- 日時データ
- カテゴリデータ
- 名寄せ
29 データの加工②データクレンジング
- データクレンジング
- 外れ値の処置の方針
- 外れ値の処置
- 欠損値の処置の方針
- 欠損値の処置
30 データの加工③データ構造の加工
- データ構造の加工
- データの統合
- データの抽出と集計
- データの正規化と標準化
31 データ分析①現状把握,将来予測,未知の関係性探索
- 現状把握
- 将来予測
- 未知の関係性探索
32 データ分析②数理最適化
- 数理最適化とは
7章 データ分析の結果の評価
33 分析結果の正確性の評価①回帰分析の評価指標
- 回帰分析の評価指標
34 分析結果の正確性の評価②分類問題の評価指標
- 分類問題の評価指標
35 分析結果の正確性の評価③モデルの汎化性能の評価
- モデルの汎化性能の評価
- AICとBIC
- 交差検証(クロスバリデーション)
36 分析結果の信頼性の評価
- 分析結果の評価には「信頼性」も重要
- 統計的有意性の評価
- データの品質評価
37 分析結果の洞察
- 洞察に有効な特異点,相違点,傾向性,関連性
- 可視化による特性の発見
38 分析結果のビジネス上の意味を捉える
- 重要な2つのポイント
- 相関関係と因果関係の区別
- ドメイン知識の活用
39 分析の改善・見直し①データの改善
- 分析は必ず改善や見直しを検討
- データの改善
40 分析の改善・見直し②手法の改善
- データの特性に適した手法への切り替え
- より高度なアルゴリズムへの変更
- モデルの性能向上テクニック
41 分析の改善・見直し③評価指標の見直し
- 評価指標の見直しは重要
42 分析結果の報告①報告に記載すべき事項
- 報告は重要なプロセス
- 報告のサマリー
- データ分析の背景と目的
- 分析に使用したデータの概要
- 分析方法とプロセス
- 分析結果
- 考察と推奨アクションの提言
43 分析結果の報告②報告書作成のポイントと注意点
- 報告は受け手の印象を大きく左右する
- ストーリーの考案
- 表現上の注意点
- 報告内容をわかりやすくする工夫
- 見栄えや表記ルールなどの基本を徹底する
- 表やグラフの活用
- 最後に見直しとリハーサル
付録 組織でデータを活用するために
01 効率的にデータを活用するための組織づくり
- 組織におけるデータ活用でよくある課題
- データガバナンスとデータマネジメント
- データパイプラインの整理
- データマネジメントを始めるための知識体系「DMBOK」
02 データ分析人材の確保
- データ分析人材に求められるスキル
- データ分析に必要な基礎知識
- どのようにして育成を行うか