書籍概要

Pythonで学ぶはじめてのデータサイエンス

著者
発売日
更新日

概要

文理を問わないすべての大学生が身に着けるべきデータサイエンスの基礎を,Pythonを使った演習を行いながら実践的に学べる教科書です。数学的なバックグラウンドが無くても,概要を理解しながら飽きずに進めることができる内容です。数理・データサイエンス・AI教育プログラム認定制度(リテラシーレベル)に準拠。大学,大学院の講義で教科書として使用しやすいよう,全14章で構成しています。

こんな方におすすめ

  • データサイエンスを基礎から学びたい人
  • 文系・理系の大学生
  • 講義で使用したい先生

目次

第1章 データサイエンスへのいざない

  • 1-1 データ(Data)
  • 1-2 データサイエンス(Data science)
  • 1-3 データサイエンティスト
  • 1-4 データサイエンスにおける分析手法
  • 演習問題

第2章 データサイエンスのためのPythonプログラミング

  • 2-1 プログラミングの基本
  • 2-2 データの構造
  • 2-3 Pythonの準備と実行
  • 演習問題

第3章 データサイエンスのためのデータ収集

  • 3-1 公開データの収集
  • 3-2 アンケート調査
  • 演習問題

第4章 データサイエンスのためのデータ前処理

  • 4-1 データの蓄積
  • 4-2 データ加工の技術
  • 4-3 データクレンジング
  • 演習問題

第5章 データサイエンスのための確率統計

  • 5-1 直感と数学
  • 5-2 数え上げ
  • 5-3 集合と場合の数
  • 5-4 確率
  • 5-5 基本統計量
  • 演習問題

第6章 統計的検定を用いたデータサイエンス

  • 6-1 確率分布
  • 6-2 推測統計
  • 演習問題

第7章 A/Bテストを用いたデータサイエンス

  • 7-1 A/Bテスト
  • 7-2 「平均値の差の検定」と「独立性の検定」
  • 7-3 アンケート調査によるデータの分析
  • 演習問題

第8章 データサイエンスのためのアルゴリズム

  • 8-1 ソフトウェアとアルゴリズム
  • 8-2 組み合わせ爆発
  • 8-3 探索問題
  • 演習問題

第9章 回帰AIを用いたデータサイエンス

  • 9-1 回帰(Regression)
  • 9-2 回帰分析
  • 9-3 重回帰分析
  • 演習問題

第10章 分類AIを用いたデータサイエンス

  • 10-1 分類AI
  • 10-2 決定木
  • 10-3 アンサンブル学習
  • 演習問題

第11章 クラスタリングAIを用いたデータサイエンス

  • 11-1 クラスタリング
  • 11-2 階層的クラスタリング
  • 11-3 非階層的クラスタリング
  • 演習問題

第12章 レコメンドAIを用いたデータサイエンス

  • 12-1 連関分析
  • 12-2 協調フィルタリング
  • 演習問題

第13章 時系列データ分析AIと自然言語処理AIを用いたデータサイエンス

  • 13-1 時系列データ
  • 13-2 文章データ分析
  • 演習問題

第14章 画像分析AIを用いたデータサイエンス

  • 14-1 AIによる画像分析
  • 14-2 ニューラルネットワーク
  • 14-3 畳み込みニューラルネットワーク(Convolutional neural network)
  • 演習問題

サポート

ダウンロード

(2023年3月22日更新)

サンプルファイルのダウンロード

本書で利用するサンプルファイルのダウンロードは,次の手順で行なってください。

  • ①ご購入の証明として,本書内の特定箇所の文字列をキーワードとして入力してください。
  • ②ダウンロードをクリックすると、サンプルファイルのダウンロードが始まります。

data_science_sample.zip(34MB)

ダウンロードしたdata_science_sample.zipの中には,節と演習問題のフォルダがあり,演習や演習問題で使用するための表などのデータファイル(xlsxやcsv)を収録しています。

サンプルファイルはZIP形式で圧縮されています。ZIP形式の圧縮ファイルは,XP以降のWindowsでは通常のフォルダと同じように操作できます。

ダウンロードしたZIPをダブルクリックすると中を見ることができます。

右クリックして「すべて展開」を選び,任意のフォルダに展開してお使いください。

なお,ZIP形式の圧縮ファイルの詳しい操作方法については,Windowsの解説書などをご参照ください。

演習で利用するプログラムのソースリスト

本書の解説中,演習で利用するプログラムのソースリストや実行結果は下記のリンクからアクセスできます。

演習問題の解答について(教育機関の関係者の方へ)

本書では,授業の成績評価に利用できるようにするため,演習問題の解答については非掲載としています。

演習問題の解答の送付をご希望の方は,以下のメールアドレスまでご連絡ください。

chuo.univ.it_at_gmail.com
(「_at_」を「@」に変換してください。)

正誤表

本書の以下の部分に誤りがありました。ここに訂正するとともに,ご迷惑をおかけしたことを深くお詫び申し上げます。

(2023年8月28日最終更新)

P.5/3行目

データサイエンスのためのデータ前処理
データサイエンスのためのデータ収集

(以下2023年7月12日更新)

P.260/リスト13-10 実行結果

誤:大文字を小文字に変換.PNG

正:大文字を小文字に変換.PNG

(以下2023年7月11日更新)

P.252/リスト13-5 1行目

from fbprophet import Prophet
from prophet import Prophet

(以下2023年6月19日更新)

P.155,P.156の一次式

「y=a+bx」
「y=ax+b」

「bx」の「x」は不要です。

(以下2023年5月30日更新)

P.111 「リスト6-1」

else:
print("帰無仮説は受容され、対立仮説は採択されない")
print("ポテトチップスの平均内容量は150グラムではない")
else:
print("帰無仮説は受容され、対立仮説は採択されない")
print("ポテトチップスの平均内容量は150グラムである")

(以下2023年5月18日更新)

P.248 「リスト13-1」Prophetのインストール

Google Colaboratoryのバージョンアップに対応するため,ソースコードを以下のように訂正してください。

!pip install pystan~=2.14
!pip install fbprophet
!pip install prophet

(以下2023年4月5日更新)

P.112 下から1行目

会社Aの平均年収
風邪薬を飲むと風邪が治る確率

商品一覧