絵と図でわかるシリーズ絵と図でわかる
データサイエンス
――難しい数式なしに考え方の基礎が学べる

[表紙]絵と図でわかる データサイエンス ――難しい数式なしに考え方の基礎が学べる

紙版発売
電子版発売

B5変形判/192ページ

定価2,200円(本体2,000円+税10%)

ISBN 978-4-297-12127-3

電子版

→学校・法人一括購入ご検討の皆様へ

書籍の概要

この本の概要

情報通信技術(ITC)が高度に発展した今日,私たちは,さまざまなデータに囲まれて暮らしています。データがなければ,ありふれた日々の営みですらスムーズには行えません。そんな現代社会で必須の「データ」を扱う科学が,「データサイエンス」です。本書は,データサイエンスの概観がざっくりと把握できるよう,イラストや図をたくさん使って,やさしく解説した「入門の入門書」です。難しい数式は使っていないので,数式が苦手な方にもおすすめです。Excelでデータサイエンスを体験できるダウンロードデータ付き。

こんな方におすすめ

  • 数式が苦手だが,データサイエンスを学んでみたい人
  • データサイエンスを学ばなければならないが,数式が苦手な人
  • データサイエンスについて,ざっくりとわかる入門書を探している人

この書籍に関連する記事があります!

「おすすめ」に囲まれた暮らしの先に
インターネットで買い物をしていたら,選んでいないのに「おすすめ」や「こちらもおすすめ」などの商品が表示され,「ほぅ,こんなものもあるのか」と当初は買うつもりのなかった商品を買ってしまった経験のある方は多いと思います。

本書のサンプル

本書の一部ページを,PDFで確認することができます。

本書の紙面イメージは次のとおりです。画像をクリックすることで拡大して確認することができます。

サンプル画像1

サンプル画像2

サンプル画像3

サンプル画像4

目次

  • はじめに

第1章 データサイエンスとは―データと社会―

  • 1-1 データと社会
    • 1)私たちの日常生活とデータ
    • 2)データ化社会がやってきた
  • 1-2 データサイエンスとデータサイエンティスト
    • 1)データサイエンスはさまざまな定義が可能な科学
    • 2)データ解析の4つの工程
    • 3)データサイエンティストの仕事

第2章 データを知る―データ解析の第1工程―

  • 2-1 データのタイプを分類する
    • 1)調査データと非調査データ
    • 2)ビッグデータと非ビッグデータ
  • 2-2 データの特徴をつかむ
    • 1)変数とデータ
    • 2)量的データと質的データ
    • 3)個票データと集計データ
  • 2-3 データを準備する
    • 1)調査によるデータ収集
    • 2)Webによるデータ収集
  • 2-4 データを整形する
    • 1)データを整形するとは
    • 2)完全データと不完全データ
    • 3)外れ値
    • 4)選択バイアス

第3章 データを読む―データ解析の第2工程―

  • 3-1 データを集計し可視化する
    • 1)データの分布を把握する
    • 2)さまざまなグラフ
  • 3-2 データの情報を要約する
    • 1)データの情報を得る
    • 2)1変数のデータの特徴をつかむ
    • 3)2変数の関係を見つける
    • 4)多次元データの関係を把握する
    • 5)結論を一般化するために

第4章 データを分類する―データ解析の第3工程―

  • 4-1 似たもの同士を分類する
    • 1)クラスター分析の考え方
    • 2)クラスター分析で分類する
  • 4-2 複数の変数を合成する
    • 1)主成分分析の考え方
    • 2)主成分分析で分類する
  • 4-3 質的データを分類する
    • 1)数量化Ⅲ類の考え方
    • 2)数量化Ⅲ類で分類する

第5章 データから予測する―データ解析の第4工程―

  • 5-1 データに基づいて予測する
    • 1)回帰分析の考え方
    • 2)回帰分析で予測する
  • 5-2 予測のよさを評価する
    • 1)重回帰分析の考え方
    • 2)よい回帰モデルとは
    • 3)さまざまな回帰診断
  • 5-3 質的データを予測する
    • 1)数量化Ⅰ類
    • 2)ロジスティック回帰

第6章 データの倫理を考える―データ化社会への警鐘―

  • 6-1 データの倫理とは
    • 1)データの倫理とデータ化社会
    • 2)情報倫理の4つの原則とデータ倫理の規範例
    • 3)分析の倫理
  • 6-2 倫理違反の事件簿
    • 1)ディオバン事件
    • 2)統計不正事件

第7章 データサイエンスとAI―ビッグデータがもたらしたデータ革命―

  • 7-1 機械学習の基本
    • 1)機械学習・深層学習・AI
    • 2)データプレパレーション
    • 3)選択アルゴリズム
    • 4)パラメータチューニング
    • 5)モデル選択
  • 7-2 ニューラルネットワークとAI
    • 1)AIとデータサイエンスの関係
    • 2)ニューラルネットワークとは
    • 3)ニューラルネットワークの構成要素
  • 付録 データサイエンスを体験する
  • データサイエンスの理解を深めるための参考図書
  • 索引

著者プロフィール

上藤一郎(うわふじいちろう)

静岡大学人文社会科学部教授。専攻は統計学,科学史(統計学史,確率論史)。データサイエンス関連の著書・訳書に,『データサイエンス入門-Excelで学ぶ統計データの見方・使い方・集め方』オーム社(共著),『調査と分析のための統計-社会・経済のデータサイエンス-』丸善(共著),『数式なしでわかるデータサイエンス-ビッグデータ時代に必要なデータリテラシー』オーム社(訳書),など。