絵と図でわかるシリーズ絵と図でわかる
データサイエンス
――難しい数式なしに考え方の基礎が学べる

[表紙]絵と図でわかる データサイエンス ――難しい数式なしに考え方の基礎が学べる

紙版発売

B5変形判/192ページ

定価2,200円(本体2,000円+税10%)

ISBN 978-4-297-12127-3

電子版
  • 電子化の予定があります

→学校・法人一括購入ご検討の皆様へ

書籍の概要

この本の概要

情報通信技術(ITC)が高度に発展した今日,私たちは,さまざまなデータに囲まれて暮らしています。データがなければ,ありふれた日々の営みですらスムーズには行えません。そんな現代社会で必須の「データ」を扱う科学が,「データサイエンス」です。本書は,データサイエンスの概観がざっくりと把握できるよう,イラストや図をたくさん使って,やさしく解説した「入門の入門書」です。難しい数式は使っていないので,数式が苦手な方にもおすすめです。Excelでデータサイエンスを体験できるダウンロードデータ付き。

こんな方におすすめ

  • 数式が苦手だが,データサイエンスを学んでみたい人
  • データサイエンスを学ばなければならないが,数式が苦手な人
  • データサイエンスについて,ざっくりとわかる入門書を探している人

本書のサンプル

本書の一部ページを,PDFで確認することができます。

本書の紙面イメージは次のとおりです。画像をクリックすることで拡大して確認することができます。

サンプル画像1

サンプル画像2

サンプル画像3

サンプル画像4

目次

  • はじめに

第1章 データサイエンスとは―データと社会―

  • 1-1 データと社会
    • 1)私たちの日常生活とデータ
    • 2)データ化社会がやってきた
  • 1-2 データサイエンスとデータサイエンティスト
    • 1)データサイエンスはさまざまな定義が可能な科学
    • 2)データ解析の4つの工程
    • 3)データサイエンティストの仕事

第2章 データを知る―データ解析の第1工程―

  • 2-1 データのタイプを分類する
    • 1)調査データと非調査データ
    • 2)ビッグデータと非ビッグデータ
  • 2-2 データの特徴をつかむ
    • 1)変数とデータ
    • 2)量的データと質的データ
    • 3)個票データと集計データ
  • 2-3 データを準備する
    • 1)調査によるデータ収集
    • 2)Webによるデータ収集
  • 2-4 データを整形する
    • 1)データを整形するとは
    • 2)完全データと不完全データ
    • 3)外れ値
    • 4)選択バイアス

第3章 データを読む―データ解析の第2工程―

  • 3-1 データを集計し可視化する
    • 1)データの分布を把握する
    • 2)さまざまなグラフ
  • 3-2 データの情報を要約する
    • 1)データの情報を得る
    • 2)1変数のデータの特徴をつかむ
    • 3)2変数の関係を見つける
    • 4)多次元データの関係を把握する
    • 5)結論を一般化するために

第4章 データを分類する―データ解析の第3工程―

  • 4-1 似たもの同士を分類する
    • 1)クラスター分析の考え方
    • 2)クラスター分析で分類する
  • 4-2 複数の変数を合成する
    • 1)主成分分析の考え方
    • 2)主成分分析で分類する
  • 4-3 質的データを分類する
    • 1)数量化Ⅲ類の考え方
    • 2)数量化Ⅲ類で分類する

第5章 データから予測する―データ解析の第4工程―

  • 5-1 データに基づいて予測する
    • 1)回帰分析の考え方
    • 2)回帰分析で予測する
  • 5-2 予測のよさを評価する
    • 1)重回帰分析の考え方
    • 2)よい回帰モデルとは
    • 3)さまざまな回帰診断
  • 5-3 質的データを予測する
    • 1)数量化Ⅰ類
    • 2)ロジスティック回帰

第6章 データの倫理を考える―データ化社会への警鐘―

  • 6-1 データの倫理とは
    • 1)データの倫理とデータ化社会
    • 2)情報倫理の4つの原則とデータ倫理の規範例
    • 3)分析の倫理
  • 6-2 倫理違反の事件簿
    • 1)ディオバン事件
    • 2)統計不正事件

第7章 データサイエンスとAI―ビッグデータがもたらしたデータ革命―

  • 7-1 機械学習の基本
    • 1)機械学習・深層学習・AI
    • 2)データプレパレーション
    • 3)選択アルゴリズム
    • 4)パラメータチューニング
    • 5)モデル選択
  • 7-2 ニューラルネットワークとAI
    • 1)AIとデータサイエンスの関係
    • 2)ニューラルネットワークとは
    • 3)ニューラルネットワークの構成要素
  • 付録 データサイエンスを体験する
  • データサイエンスの理解を深めるための参考図書
  • 索引

著者プロフィール

上藤一郎(うわふじいちろう)

静岡大学人文社会科学部教授。専攻は統計学,科学史(統計学史,確率論史)。データサイエンス関連の著書・訳書に,『データサイエンス入門-Excelで学ぶ統計データの見方・使い方・集め方』オーム社(共著),『調査と分析のための統計-社会・経済のデータサイエンス-』丸善(共著),『数式なしでわかるデータサイエンス-ビッグデータ時代に必要なデータリテラシー』オーム社(訳書),など。