ITエンジニアのための強化学習理論入門
2020年7月17日紙版発売
2020年7月17日電子版発売
中井悦司 著
A5判/296ページ
定価3,278円(本体2,980円+税10%)
ISBN 978-4-297-11515-9
書籍の概要
この本の概要
前作の『ITエンジニアのための機械学習理論入門』から,5年経過しましたが,AI(人工知能)や機械学習に対しての期待と関心はまったく衰えません。むしろ機械学習の利用はIT業界で当然のものとなり,さらなる活用がさまざまな場所で行われています。前作では一般的な機械学習について解説しましたが,試行錯誤しながら1つの解をもとめていく「強化学習理論」についてくわしく・やさしく解説します。理論を表現するいろいろな数式とそれらをプログラミングするためのPythonコードを並列しながらその理論の神髄にせまり,強化学習の基礎となるさまざまなアルゴリズムを体系的に学びます。
こんな方におすすめ
- 機械学習,AI(人工知能)に興味があるITエンジニア,大学生,高専生,高校生など
著者の一言
「Q Learning とSARSA の違いを説明してください。」皆さんは,この質問に即答できるでしょうか? 本書を読めば,自信を持って答えられます! —— と,謎の宣伝文句(?)から始まりましたが,少しばかり背景を説明しておきましょう。
2015 年に『ITエンジニアのための機械学習理論入門』(技術評論社)を出版させていただいた後,驚くほどの勢いで機械学習の入門書が書店にあふれるようになりました。そしてまた,回帰モデルによる数値予測,分類モデルによる画像データの識別など,教師データを用いた機械学習モデル,いわゆる「教師あり学習」は,一般企業における活用が進みました。その一方で,エージェントが学習データを収集しながら学習処理を進める「強化学習」の利用は未だ敷居が高く,一般企業における活用は「まだこれから」という状況です。本書では,今後のスキルアップや強化学習の活用に向けた準備をしようと考えるIT エンジニアの方々に向けて,強化学習のアルゴリズムを基礎から解説しています。動的計画法による厳密解の導出方法から始まり,ニューラルネットワークと強化学習を組み合わせた「DQN(Deep Q Network)」まで,「強化学習がなぜうまくいくのか」という基本原理を解説します。Python で実装したコードをGoogle Colaboratory で実行しながら,それぞれのアルゴリズムがどのように機能するのかを「実感して理解する」ことが本書の一貫したテーマです。既存の機械学習ライブラリをブラックボックスとして用いるのではなく,具体的な動作原理が確認できるように,すべてのアルゴリズムを一から実装しています。「三目並べ」や「あるけあるけゲーム」など,シンプルな題材を用いて,エージェント同士の対戦による相互学習や,実行時の先読みによる性能向上など,より実践的なテクニックにも触れています。冒頭の「Q Learning」と「SARSA」は,どちらも強化学習の基礎的なアルゴリズムですが,機械学習の活用が広がるスピードを考えると,近い将来,機械学習に関わるIT エンジニアの採用面接では,冒頭のような質問が「あたりまえ」になる日が近いのかも知れません。試験対策が本書の目的ではありませんが,一般的な「教師あり学習」の仕組みを学んだ上で,次のステップとして「強化学習」に取り組みたいと考える皆さんの知的好奇心を満たし,IT エンジニアとしての活動の幅を広げるきっかけが供できれば,筆者にとってこの上ない喜びです。
この書籍に関連する記事があります!
- 「三目並べ」から学ぶ強化学習の本質
- コンピュータープログラムが囲碁や将棋のプロ棋士と対等に戦える時代になりました。
本書のサンプル
本書の紙面イメージは次のとおりです。画像をクリックすることで拡大して確認することができます。
目次
第1章 強化学習のゴールと課題
- 1.1 強化学習の考え方
- 1.2 実行環境のセットアップ
- 1.3 バンディットアルゴリズム(基本編)
- 1.4 バンディットアルゴリズム(応用編)
第2章 環境モデルを用いた強化学習の枠組み
- 2.1 マルコフ決定過程による環境のモデル化
- 2.2 エージェントの行動ポリシーと状態価値関数
- 2.3 動的計画法による状態価値関数の決定
第3章 行動ポリシーの改善アルゴリズム
- 3.1 ポリシー反復法
- 3.2 価値反復法
- 3.3 より実践的な実装例
第4章 サンプリングデータを用いた学習法
- 4.1 モンテカルロ法
- 4.2 TD(Temporal-Difference)法
第5章 ニューラルネットワークによる関数近似
- 5.1 ニューラルネットワークによる状態価値関数の計算
- 5.2 ニューラルネットワークを用いたQ-Learning
この本に関連する書籍
-
[改訂新版]ITエンジニアのための機械学習理論入門
機械学習を基礎から理論的に学びたい,そんなITエンジニアに向けて執筆された本です。初版から約5年が経過し,全面カラー化して「改訂新版」としました。Pythonのコーデ...
-
知識ゼロからの機械学習入門
2021年4月15日まで期間限定で,本書についての疑問点をTechAcademyの講師に質問できるサービスを提供! プログラミングや機械学習がはじめての方に特化した,Pythonによ...
-
AIエンジニアを目指す人のための 機械学習入門 実装しながらアルゴリズムの流れを学ぶ
機械学習はAI(人工知能)の基礎技術です。今後AIの利活用が進むにつれて、機械学習をコンピュータシステムに組み込んでビジネスに活用できる人材(本書ではAIエンジニ...
-
ITエンジニアのための機械学習理論入門
現在話題となっている機械学習(Machine Learning)のツールやライブラリは内部でどのような計算をしているのか? 計算で得られた結果にはどのような意味があり,どの...