書籍概要

はじめてのAIリテラシー

著者
発売日
更新日

概要

政府は「AI戦略2019」の中で,リテラシー教育として文理を問わず,全ての大学・高専生約50万人を対象に,初級レベルの数理・データサイエンス・AIを課程にて習得する方針を打ち出しました。これを踏まえ,各大学・高専で参照可能な「モデルカリキュラム」の検討と策定が進められています。本書はこのモデルカリキュラムのうち,基礎的な範囲に対応した教科書です。AIリテラシーの基礎を薄く広く扱います。文科省の認定制度に準拠し,半期15回の講義で進められるよう工夫されています。これから導入を考えているすべての大学・高専が対象です。

こんな方におすすめ

  • AIリテラシーを学びたい方
  • テキスト採用をお考えの先生

目次

第1講 AIリテラシーとは

1-1 AIの定義

  • AIとは
  • 強いAIと弱いAI
  • 人間らしさとAI(チューリングテスト)
  • 中国語の部屋
  • チャットボット
  • ELIZA効果

1-2 なぜAIが必要とされているのか

  • AIへの期待
  • ハイプ曲線
  • AIブーム

1-3 この本ではどこまで学ぶか

  • AIのしくみや原理
  • AIの発展と人間の自由
    • コラム 数理・データサイエンス・AI教育プログラム認定制度について

第2講 社会でどのような変化が起きているか

2-1 ビッグデータ,IoT,5Gなどの登場

  • ビッグデータとは
  • ビッグデータの定義
  • オープンデータの活動
  • IoTとビッグデータ
  • 5GはIoTを促進

2-2 第4次産業革命,Society5.0

  • 進化するテクノロジーと社会
  • 第4次産業革命のテクノロジー
  • 新しい社会Society5.0

2-3 データ駆動型社会

  • データ革命による他分野への応用
  • データ駆動型社会とは
  • データの扱い方が重要

第3講 社会でどのようなデータが活用されているか

3-1 人の動線をめぐるデータ

  • 注目される私的データ
  • カーナビの例
  • 監視カメラの例

3-2 多くの機器のログとオープンデータ

  • SNSのデータ分析
  • オープンデータの活用
  • ログによるアクセスデータ

3-3 1次データ,2次データ,メタデータ

  • 1次データと2次データ
  • メタデータ

3-4 非構造化データの増大

  • データベースとデータの構造化
  • 非構造化データの活用

第4講 データ・AIを何に使えるか

4-1 データ・AIの活用領域の広がり

  • 身近になっていくデータサイエンス
  • 多様化するデータの活用例
  • 日本でのデータ利活用
  • 匿名加工情報

4-2 具体的にどう使えばいいのか

  • データの使い方・仮説検証型
  • データの使い方・仮説探索型
  • 人の負担を軽減するエスカレーション
  • AIが得意な仕事,苦手な仕事
  • 意思決定支援システム
  • AIの意外な使い方

4-3 シェアリングエコノミー,エビデンスベース社会,ナッジ

  • シェアリングエコノミーとは
  • データとAIの活用で上手にマッチング
  • ネットの信頼性とリスク
  • エビデンスベース社会とは

第5講 データ・AIの技術

5-1 データ解析とは何をしているのか

  • 昔から解析は行われていた
  • AIによるデータ解析の特徴

5-2 可視化の手法にはどういったものがあるのか

  • グラフによる可視化
  • 地図を使った可視化
  • 動的な可視化

5-3 非構造化データの処理とは

  • 言語処理
  • 画像処理
  • 音声処理

5-4 AIの技術とは

  • コンピュータ自ら学習する機械学習
  • 教師あり学習,教師なし学習
  • 強化学習
  • 深層学習(ディープラーニング)
  • 転移学習

第6講 データを読み,説明し,扱う

6-1データの種類を知る

  • データの種類を知って正しく使う
  • 連続データと離散データ
  • 質的データと量的データ
    • コラム データを扱うときの注意点

6-2 基本統計量でデータの特徴をつかむ

  • 基本統計量とは
  • データの真ん中を表す指標
  • データの散らばり具合を見る

6-3 もととなるデータを集める

  • 母集団と標本
  • 標本誤差
  • 無作為抽出

6-4 集めたデータを集計する

  • クロス集計
  • 相関関係と因果関係
  • 地図上の可視化

6-5 誤読しないデータの読み方,データの比較方法

  • 騙されやすいグラフの例
    • コラム 新技術との付き合い方について

第7講 データ・AIを扱うときに注意すること

7-1 データ活用の負の側面

  • かゆいところに手が届くビッグデータの活用
  • 自分のデータが勝手に記録され,保存される

7-2 GDPR,忘れられる権利,ELSI,オプトイン・オプトアウト

  • EUの取り組み
  • GDPRの定める権利
  • ELSIとSTEM
  • トロッコ問題
  • オプトイン・オプトアウト

7-3 データの正義について

  • 機械がやるから公平か?
  • AIの判断は正しい?
  • 道路標識を誤認させる攻撃
  • 人間中心のAI社会原則

第8講 データ・AIにまつわるセキュリティ

8-1 情報セキュリティの基礎

  • セキュリティとは
  • セキュリティでは「リスク」に注目
  • 経営資源(情報資産),脅威,脆弱性
  • リスクの顕在化
  • セキュリティ対策の手順と受容水準
  • リスクへの対応方法

8-2 情報のCIA

  • 機密性,完全性,可用性
  • 多要素認証

8-3 暗号化と匿名加工情報

  • 暗号化とは
  • 個人情報の保護と匿名加工情報

第9講 統計と数学のきほん

9-1 AIに必要な数学

  • AIの理解には数学が必要
  • 誕生日のパラドックス
  • クーポン収集問題
  • 数え上げ

9-2 AIに必要な集合・場合の数

  • 「集合」と「場合の数」
  • 和の法則
  • 積の法則

9-3 AIに必要な確率・統計

  • 確率
  • 確率分布
  • 推測統計
    • コラム ナイチンゲールとデータサイエンス

第10講 アルゴリズムとは何か

10-1 AIとアルゴリズム

  • アルゴリズムとは
  • ハードウェアとソフトウェア
  • ソフトウェアの性能を上げる
  • アルゴリズム工学

10-2 組み合せ爆発を攻略するAIのアルゴリズム

  • 組み合せ爆発とは
  • ボードゲームに挑むAI
  • 総当たりアルゴリズム
  • 近似アルゴリズム
  • 確率的アルゴリズム

10-3 探索問題

  • 探索問題とは
  • 線形探索
  • 二分探索

10-4 二部マッチング問題

  • 二部マッチング問題とは
  • 局所最適
  • 全体最適

第11講 データの構造とプログラミング

11-1 ソフトウェアのプログラミング

  • プログラミングスキルを身につけよう
  • プログラミングとは

11-2 プログラミングの歴史

  • 世界初のコンピュータENIAC

11-3 データの構造

  • 10進数と2進数
  • ビットとバイト
  • 文字コード

11-4 プログラミング環境の構築

  • Pythonの導入
  • Colaboratoryの使い方

11-5 変数

  • 変数と変数名
  • 変数に値を代入
  • 変数の内容を更新

11-6 条件分岐

  • 条件分岐とは
  • If文
  • PythonでIf文のプログラミング

11-7 繰り返し

  • ループ処理
  • for文
  • Pythonでfor文のプログラミング

第12講 データを上手に扱うには

12-1 ビッグデータの収集

  • データは21世紀の石油
  • 多種大量のビッグデータ

12-2 データベース

  • データベースとは
  • RDBと正規化

12-3 データ加工

  • データ結合
  • Pythonで分析-データの準備
  • Pythonで分析-読み込み
  • Pythonで分析-結合

12-4 データクレンジング

  • データクレンジングとは
  • Pythonでデータクレンジング
  • データの読み込み
  • データを補完
  • 表記揺れの修正
  • 欠損値の変更

第13講 時系列データと文章データの分析

13-1 時系列データ分析

  • 時系列データ分析とは
  • 時系列データと点過程データの違い
  • 目的変数を説明変数

13-2 時系列データの変動要因

  • 傾向変動
  • 循環変動
  • 季節変動
  • 不規則変動

13-3 時系列データ分析演習(二酸化炭素排出量の予測)

  • Prophetのインストール
  • 時系列データの読み込み
  • 時系列データの可視化
  • 時系列データの事前処理
  • 時系列データの将来予測

13-4 文章データ分析

  • 文章データとは
  • 分かち書き(トークン化)
  • 形態素解析
  • N-gram解析

13-5 文章データ分析演習(スパムメールフィルタの作成)

  • データセットの読み込み
  • ワードクラウドの作成
  • ストップワードの除去
  • 形態素解析の実行
  • スパムを分類するAIの作成

第14講 データ活用実践(教師あり学習と教師なし学習)

14-1 AIの学習方式

  • 機械学習とAI
  • 教師あり学習
  • 教師なし学習
  • 強化学習

14-2 教師あり学習の出力

  • 分類
  • 回帰

14-3 教示なし学習の出力

  • クラスタリング
  • 連関分析

14-4 過学習と汎化

  • 過学習
  • 汎化

14-5 データ活用実践1-教師あり学習,分類

  • データセットの入手
  • データセットの読み込み
  • 事前準備
  • ランダムフォレストによる教師あり学習
  • プログラムの実行

14-6 データ活用実践2-教師あり学習,回帰

  • データセットの入手
  • データセットの読み込み
  • 事前準備
  • 単回帰分析による教師あり学習
  • グラフによる可視化
  • 決定係数

14-7 データ活用実践3-教師なし学習,連関分析

  • データセットの入手と読み込み
  • データ形式の変形
  • ライブラリのインストール
  • 頻出商品の抽出
  • 連関分析の実行

サポート

ダウンロード

サンプルファイルのダウンロード

本書で利用するサンプルファイルのダウンロードは,以下のリンクをクリックしてください。

ダウンロード
ai_literacy_sample.zip

サンプルファイルはZIP形式で圧縮されています。ZIP形式の圧縮ファイルは,XP以降のWindowsでは通常のフォルダと同じように操作できます。
ダウンロードしたZIPをダブルクリックすると中を見ることができます。
右クリックして「すべて展開」を選び,任意のフォルダに展開してお使いください。
ZIP形式の圧縮ファイルの詳しい操作方法については,Windowsの解説書などをご参照ください。 ダウンロードしたai_literacy_sample.zipの中には講ごとに分かれたフォルダがあり,その中に本書で利用するサンプルファイルが入っています。
サンプルファイルの内容については本文P.12を参照してください。

実習で利用するプログラムのソースリスト

本書の解説中,実習で利用するプログラムのソースリストや実行結果は下記のリンクからアクセスできます。

図版データのダウンロード

(2022年2月21日更新)

本書をご購入いただいた方は,本書で紹介している図版データをダウンロードいただけます。以下の圧縮ファイルをダウンロードしていただき,適宜解凍してご利用ください。

なお,本書を用いた講義用のスライドにのみ使用を許諾しております。それ以外のデータの一部または全てを無断で複製・変更・使用することはできません。ご注意ください。

ご購入の証明として,以下に表示される本書内の特定箇所の文字列をキーワードとして入力してください。

授業用jpeg.zip(74MB)

正誤表

本書の以下の部分に誤りがありました。ここに訂正するとともに,ご迷惑をおかけしたことを深くお詫び申し上げます。

(2023年11月27日最終更新)

P.224〜228で使用するBoston Housingデータセットについて

記載のコードでエラーが発生します。下記の対応をしてください。

現在,Boston HousingデータセットがPythonから直接ダウンロードできません。そのため下記のリンクのファイルをダウンロードし,Colaboratoryにアップロードして,下記のプログラムを実行してください。

Boston Housingデータセットのダウンロード
boston_clean.xlsx
※Google Colaboratoryへのファイルのアップロード方法

https://kenko-keep.com/google-colab-upload/

※ファイルを読み込むためのプログラム(リスト14-5の代わり)
import pandas as pd
df = pd.read_excel('boston_clean.xlsx')
df.head()

(以下2023年6月19日更新)

P.193/リスト13-1

!pip install pystan~=2.14
!pip install fbprophet
!pip install prophet

P.197/リスト13-5の1行目

from fbprophet import Prophet
from prophet import Prophet

商品一覧