わけがわかる機械学習
─現実の問題を解くために、しくみを理解する

書籍の概要

この本の概要

機械学習が話題に上ることも増えてきましたが,実際には手っ取り早くできるものではなく,ライブラリを使うだけではやりたいことをうまく実現できません。もとになる考えかたや基礎的なモデルを知っていなければ,パラメータの意味がわからなかったり,目の前の問題に対してまったく向いていないモデルを使ってしまうからです。こういった状況に対し本書では,機械学習の理論を知ることで,機械学習を実際に活用していくための基礎をきっちりと固めることを目的とします。

こんな方におすすめ

  • これから機械学習を勉強したいと考えているエンジニア
  • すでに機械学習に手をつけてはいるが,うまい結果が出せないでいるエンジニア
  • 機械学習の教科書を読むための前提知識が欲しい学生

著者の一言

のっけから失礼しますが,機械学習をなんのために勉強しますか? おもしろそうだから,という人もいるでしょうが,ほとんどの人は現実の解きたい問題に応用するためですよね。
何かを応用できる形で身につけたいとき,ひたすら「こういうときはこうする」を覚えるという手があります。実際,教科書や問題集に載っているような問題なら,「こういうときはこうする」でだいたい解けるでしょう。
しかし現実の問題はパターンもデータも千差万別,算数のドリルのようには解けません。しかも本書でのちほど説明するとおり,機械学習には正解なんかありません。100点満点の答えが存在しないからこそ,「なぜその方法で解いたのか」「なぜそんな計算ができるのか」は重要です。
もう少し具体的に言うと,機械学習そのものやそのモデル・アルゴリズムがその形になっている成り立ちや動機を知り,「機械学習がそんなことをしたい,してもいい理由(わけ)」を把握することで,今解きたい問題に機械学習を使うにはどうしたらよいか,どこを変えると性能を上げられる可能性があるか,そもそも機械学習を使わないほうがいいか(!)という判断ができるようになります。
とはいえ,機械学習のモデルは無数にあり,すべてのモデルがそれぞれの理由を持っています。そのすべてを紹介することは不可能ですが,機械学習の理由を組み立てるパターンは実はそんなに多くありません。この「機械学習の理由を組み立てるパターン」が本書のテーマ,機械学習の「理屈」と呼んでいます。
機械学習の「理論」とどう違うの? という疑問もあるかもしれませんね。機械学習の理論とは,体系付けられた知識と,それをもとに「こうあるべき」を分析したものです。平たく言うと,「機械学習は何ができるのか,何ができないのか」を明らかにするのが理論の仕事であり,機械学習を安心して使うためにとても重要です。「機械学習でそうするべき理由」は理論で説明できますが,本書のターゲットである「そうしたい理由」は説明できません。
この本は機械学習を身につける早道ではありませんが,機械学習をこれから勉強しようとしている人,機械学習を勉強してみたけど「なぜこんなことをするんだろう」というモヤモヤを抱えている人には,機械学習の理由(わけ)や理屈という「急がば回れ」はきっとよく効くと思います。

『「はじめに」より』

この書籍に関連する記事があります!

機械学習って,どんなふうに勉強すればいいの?
機械学習をどう学ぶか,これはむずかしい問題です。

本書のサンプル

本書の一部ページを,PDFで確認することができます。

目次

第0章 はじめに

  • 0.1 本書の対象読者と構成
  • 0.2 謝辞

第1章 機械学習ことはじめ

  • 1.1 機械学習とは
  • 1.2 モデルとは
  • 1.3 深層学習とは
  • 1.4 人工知能とは

第2章 確率

  • 2.1 「起きやすさ」を数値で表す方法
  • 2.2 確率
  • 2.3 確率変数と確率分布
  • 2.4 同時確率と条件付き確率
  • 2.5 確率の周辺化と積の公式
  • 2.6 3個以上の確率変数
  • 2.7 確率の独立性
  • 2.8 ベイズ公式

第3章 連続確率と正規分布

  • 3.1 連続確率
  • 3.2 確率密度関数
  • 3.3 複数変数の連続確率
  • 3.4 確率の平均と分散
  • 3.5 二項分布
  • 3.6 正規分布
  • 3.7 中心極限定理
  • 3.8 多次元正規分布

第4章 線形回帰

  • 4.1 最小二乗法
  • 4.2 最小二乗法の4つの仮定
  • 4.3 線形回帰
  • 4.4 線形回帰の解き方
  • 4.5 過学習と不良設定問題
  • 4.6 正則化
  • 4.7 正則化項あり線形回帰の解き方
  • 4.8 ガウス基底を使った線形回帰

第5章 ベイズ確率

  • 5.1 確率の確率
  • 5.2 ベイズ確率
  • 5.3 ベイズ事前分布

第6章 ベイズ線形回帰

  • 6.1 ノイズの分布
  • 6.2 最尤推定
  • 6.3 ベイズ線形回帰
  • 6.4 ベイズ予測分布

第7章 分類問題

  • 7.1 ナイーブベイズ分類器
  • 7.2 パーセプトロン
  • 7.3 2種類のエラー
  • 7.4 ロジスティック回帰
  • 7.5 多値ロジスティック回帰

第8章 最適化

  • 8.1 勾配法
  • 8.2 勾配法の性質
  • 8.3 確率的勾配降下法
  • 8.4 ロジスティック回帰の学習

第9章 モデル選択

  • 9.1 モデルの汎化性能
  • 9.2 交差検証
  • 9.3 モデル選択と正則化

第10章 おわりに

  • 10.1 機械学習を使わないという選択肢

付録A 本書で用いる数学

  • A.1 線形代数
  • A.2 解析

著者プロフィール

中谷秀洋(なかたにしゅうよう)

サイボウズ・ラボ(株)所属。子供のころからプログラムと小説を書き,現在は機械学習や自然言語処理,VRを中心とした研究開発に携わる。著書に『[プログラミング体感まんが]ぺたスクリプト ── もしもプログラミングできるシールがあったなら』(技術評論社)がある。