目次
第1講 AIリテラシーとは
1-1 AIの定義
- AIとは
- 強いAIと弱いAI
- 人間らしさとAI(チューリングテスト)
- 中国語の部屋
- チャットボット
- ELIZA効果
1-2 なぜAIが必要とされているのか
- AIへの期待
- ハイプ曲線
- AIブーム
1-3 この本ではどこまで学ぶか
- AIのしくみや原理
- AIの発展と人間の自由
- コラム 数理・データサイエンス・AI教育プログラム認定制度について
第2講 社会でどのような変化が起きているか
2-1 ビッグデータ,IoT,5Gなどの登場
- ビッグデータとは
- ビッグデータの定義
- オープンデータの活動
- IoTとビッグデータ
- 5GはIoTを促進
2-2 第4次産業革命,Society5.0
- 進化するテクノロジーと社会
- 第4次産業革命のテクノロジー
- 新しい社会Society5.0
2-3 データ駆動型社会
- データ革命による他分野への応用
- データ駆動型社会とは
- データの扱い方が重要
第3講 社会でどのようなデータが活用されているか
3-1 人の動線をめぐるデータ
- 注目される私的データ
- カーナビの例
- 監視カメラの例
3-2 多くの機器のログとオープンデータ
- SNSのデータ分析
- オープンデータの活用
- ログによるアクセスデータ
3-3 1次データ,2次データ,メタデータ
- 1次データと2次データ
- メタデータ
3-4 非構造化データの増大
- データベースとデータの構造化
- 非構造化データの活用
第4講 データ・AIを何に使えるか
4-1 データ・AIの活用領域の広がり
- 身近になっていくデータサイエンス
- 多様化するデータの活用例
- 日本でのデータ利活用
- 匿名加工情報
4-2 具体的にどう使えばいいのか
- データの使い方・仮説検証型
- データの使い方・仮説探索型
- 人の負担を軽減するエスカレーション
- AIが得意な仕事,苦手な仕事
- 意思決定支援システム
- AIの意外な使い方
4-3 シェアリングエコノミー,エビデンスベース社会,ナッジ
- シェアリングエコノミーとは
- データとAIの活用で上手にマッチング
- ネットの信頼性とリスク
- エビデンスベース社会とは
第5講 データ・AIの技術
5-1 データ解析とは何をしているのか
- 昔から解析は行われていた
- AIによるデータ解析の特徴
5-2 可視化の手法にはどういったものがあるのか
- グラフによる可視化
- 地図を使った可視化
- 動的な可視化
5-3 非構造化データの処理とは
- 言語処理
- 画像処理
- 音声処理
5-4 AIの技術とは
- コンピュータ自ら学習する機械学習
- 教師あり学習,教師なし学習
- 強化学習
- 深層学習(ディープラーニング)
- 転移学習
第6講 データを読み,説明し,扱う
6-1データの種類を知る
- データの種類を知って正しく使う
- 連続データと離散データ
- 質的データと量的データ
- コラム データを扱うときの注意点
6-2 基本統計量でデータの特徴をつかむ
- 基本統計量とは
- データの真ん中を表す指標
- データの散らばり具合を見る
6-3 もととなるデータを集める
- 母集団と標本
- 標本誤差
- 無作為抽出
6-4 集めたデータを集計する
- クロス集計
- 相関関係と因果関係
- 地図上の可視化
6-5 誤読しないデータの読み方,データの比較方法
- 騙されやすいグラフの例
- コラム 新技術との付き合い方について
第7講 データ・AIを扱うときに注意すること
7-1 データ活用の負の側面
- かゆいところに手が届くビッグデータの活用
- 自分のデータが勝手に記録され,保存される
7-2 GDPR,忘れられる権利,ELSI,オプトイン・オプトアウト
- EUの取り組み
- GDPRの定める権利
- ELSIとSTEM
- トロッコ問題
- オプトイン・オプトアウト
7-3 データの正義について
- 機械がやるから公平か?
- AIの判断は正しい?
- 道路標識を誤認させる攻撃
- 人間中心のAI社会原則
第8講 データ・AIにまつわるセキュリティ
8-1 情報セキュリティの基礎
- セキュリティとは
- セキュリティでは「リスク」に注目
- 経営資源(情報資産),脅威,脆弱性
- リスクの顕在化
- セキュリティ対策の手順と受容水準
- リスクへの対応方法
8-2 情報のCIA
- 機密性,完全性,可用性
- 多要素認証
8-3 暗号化と匿名加工情報
- 暗号化とは
- 個人情報の保護と匿名加工情報
第9講 統計と数学のきほん
9-1 AIに必要な数学
- AIの理解には数学が必要
- 誕生日のパラドックス
- クーポン収集問題
- 数え上げ
9-2 AIに必要な集合・場合の数
- 「集合」と「場合の数」
- 和の法則
- 積の法則
9-3 AIに必要な確率・統計
- 確率
- 確率分布
- 推測統計
- コラム ナイチンゲールとデータサイエンス
第10講 アルゴリズムとは何か
10-1 AIとアルゴリズム
- アルゴリズムとは
- ハードウェアとソフトウェア
- ソフトウェアの性能を上げる
- アルゴリズム工学
10-2 組み合せ爆発を攻略するAIのアルゴリズム
- 組み合せ爆発とは
- ボードゲームに挑むAI
- 総当たりアルゴリズム
- 近似アルゴリズム
- 確率的アルゴリズム
10-3 探索問題
- 探索問題とは
- 線形探索
- 二分探索
10-4 二部マッチング問題
- 二部マッチング問題とは
- 局所最適
- 全体最適
第11講 データの構造とプログラミング
11-1 ソフトウェアのプログラミング
- プログラミングスキルを身につけよう
- プログラミングとは
11-2 プログラミングの歴史
- 世界初のコンピュータENIAC
11-3 データの構造
- 10進数と2進数
- ビットとバイト
- 文字コード
11-4 プログラミング環境の構築
- Pythonの導入
- Colaboratoryの使い方
11-5 変数
- 変数と変数名
- 変数に値を代入
- 変数の内容を更新
11-6 条件分岐
- 条件分岐とは
- If文
- PythonでIf文のプログラミング
11-7 繰り返し
- ループ処理
- for文
- Pythonでfor文のプログラミング
第12講 データを上手に扱うには
12-1 ビッグデータの収集
- データは21世紀の石油
- 多種大量のビッグデータ
12-2 データベース
- データベースとは
- RDBと正規化
12-3 データ加工
- データ結合
- Pythonで分析-データの準備
- Pythonで分析-読み込み
- Pythonで分析-結合
12-4 データクレンジング
- データクレンジングとは
- Pythonでデータクレンジング
- データの読み込み
- データを補完
- 表記揺れの修正
- 欠損値の変更
第13講 時系列データと文章データの分析
13-1 時系列データ分析
- 時系列データ分析とは
- 時系列データと点過程データの違い
- 目的変数を説明変数
13-2 時系列データの変動要因
- 傾向変動
- 循環変動
- 季節変動
- 不規則変動
13-3 時系列データ分析演習(二酸化炭素排出量の予測)
- Prophetのインストール
- 時系列データの読み込み
- 時系列データの可視化
- 時系列データの事前処理
- 時系列データの将来予測
13-4 文章データ分析
- 文章データとは
- 分かち書き(トークン化)
- 形態素解析
- N-gram解析
13-5 文章データ分析演習(スパムメールフィルタの作成)
- データセットの読み込み
- ワードクラウドの作成
- ストップワードの除去
- 形態素解析の実行
- スパムを分類するAIの作成
第14講 データ活用実践(教師あり学習と教師なし学習)
14-1 AIの学習方式
- 機械学習とAI
- 教師あり学習
- 教師なし学習
- 強化学習
14-2 教師あり学習の出力
- 分類
- 回帰
14-3 教示なし学習の出力
- クラスタリング
- 連関分析
14-4 過学習と汎化
- 過学習
- 汎化
14-5 データ活用実践1-教師あり学習,分類
- データセットの入手
- データセットの読み込み
- 事前準備
- ランダムフォレストによる教師あり学習
- プログラムの実行
14-6 データ活用実践2-教師あり学習,回帰
- データセットの入手
- データセットの読み込み
- 事前準備
- 単回帰分析による教師あり学習
- グラフによる可視化
- 決定係数
14-7 データ活用実践3-教師なし学習,連関分析
- データセットの入手と読み込み
- データ形式の変形
- ライブラリのインストール
- 頻出商品の抽出
- 連関分析の実行