自然言語処理の教科書
2024年5月24日紙版発売
2024年5月24日電子版発売
小町守 著
A5判/248ページ
定価2,860円(本体2,600円+税10%)
ISBN 978-4-297-13863-9
書籍の概要
この本の概要
深層学習の登場により,人工知能分野の技術が広く注目されています。特に自然言語処理は,我々の生活の中に深く浸透してきました。例えば検索システム,SiriやAlexaなどの音声対話システム,DeepLといった機械翻訳が挙げられます。いまや多くの企業や研究機関が,自然言語処理を用いた様々なプロジェクトを進めています。
本書はどの時代の自然言語処理にも必要となる技術について解説します。新しい技術が次々と生み出されていく中で,自然言語処理の実装に関する知識は古びてしまう可能性を孕んでいますが,本書では自然言語処理システムの開発で必要となる普遍的な知識を中心に掲載します。
解説の特色として,はじめに開発方法やデータ,評価基準など自然言語処理システムの開発全体に関する内容を載せます。続いて自然言語処理のタスク別に各システムの開発について取り上げ,どのような方針で設計するか,必要となってくる技術は何かを伝えます。最後に,類書でほとんど取り上げられていないにもかかわらず自然言語処理システムの構築には欠かせない知識となる辞書やコーパスの構築方法についても解説します。
こんな方におすすめ
- 自然言語処理関係の開発に携わる初級エンジニア
- 情報系の学部の大学生または院生
本書のサンプル
本書の紙面イメージは次のとおりです。画像をクリックすることで拡大して確認することができます。
目次
第1章 自然言語処理システムのデザイン
- 1-1 入力と出力を決定する
- 1-2 アプローチ:どのように解くか決定する
- 1-3 データ:辞書やコーパス
- 1-4 評価:評価尺度とエラー分析
- 1-5 フロー:自然言語処理システムの開発サイクル
- 1-6 まとめ
第2章 分類・回帰問題の解き方
- 2-1 評価極性分析:ポジネガを判定する
- 2-2 文書分類:記事の自動分類
- 2-3 文章の品質推定:人手で書いた文章の品質を推定する
- 2-4 演習:品質推定
- 2-5 まとめ
第3章 系列ラベリング問題の解き方
- 3-1 固有表現認識:固有表現を見つける
- 3-2 形態素解析:単語分割・品詞推定・見出し語化
- 3-3 誤り検出:誤り箇所の検出と訂正
- 3-4 演習:文法誤り検出・訂正
- 3-5 まとめ
第4章 言語生成問題の解き方
- 4-1 文書要約:長い文章の要点をまとめる
- 4-2 機械翻訳:同じ意味の別の言語で表現する
- 4-3 対話:チャットのやり取りをする
- 4-4 演習:機械翻訳
- 4-5 まとめ
第5章 言語資源のつくり方
- 5-1 言語資源の入手方法
- 5-2 言語資源構築のデザイン:継続的な品質管理
- 5-3 辞書作成
- 5-4 コーパス作成
- 5-5 ツールキット作成
- 5-6 演習:フレーズ分類ラベルアノテーション
- 5-7 まとめ
- 参考文献
- 関連論文
この本に関連する書籍
-
評価指標入門 〜データサイエンスとビジネスをつなぐ架け橋
「評価指標でXXXという最高のスコアが出た!」と喜び勇んで,機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。 ところが,ビジネス上のKPIと...
-
施策デザインのための機械学習入門 〜データ分析技術のビジネス活用における正しい考え方
予測に基づいた広告配信や商品推薦など,ビジネス施策の個別化や高性能化のために機械学習を利用することが一般的になってきています。その一方で,多くの機械学習エン...