自然言語処理の教科書

書籍の概要

この本の概要

深層学習の登場により,人工知能分野の技術が広く注目されています。特に自然言語処理は,我々の生活の中に深く浸透してきました。例えば検索システム,SiriやAlexaなどの音声対話システム,DeepLといった機械翻訳が挙げられます。いまや多くの企業や研究機関が,自然言語処理を用いた様々なプロジェクトを進めています。

本書はどの時代の自然言語処理にも必要となる技術について解説します。新しい技術が次々と生み出されていく中で,自然言語処理の実装に関する知識は古びてしまう可能性を孕んでいますが,本書では自然言語処理システムの開発で必要となる普遍的な知識を中心に掲載します。

解説の特色として,はじめに開発方法やデータ,評価基準など自然言語処理システムの開発全体に関する内容を載せます。続いて自然言語処理のタスク別に各システムの開発について取り上げ,どのような方針で設計するか,必要となってくる技術は何かを伝えます。最後に,類書でほとんど取り上げられていないにもかかわらず自然言語処理システムの構築には欠かせない知識となる辞書やコーパスの構築方法についても解説します。

こんな方におすすめ

  • 自然言語処理関係の開発に携わる初級エンジニア
  • 情報系の学部の大学生または院生

本書のサンプル

本書の紙面イメージは次のとおりです。画像をクリックすることで拡大して確認することができます。

サンプル画像1

サンプル画像2

サンプル画像3

サンプル画像4

サンプル画像5

目次

第1章 自然言語処理システムのデザイン

  • 1-1 入力と出力を決定する
  • 1-2 アプローチ:どのように解くか決定する
  • 1-3 データ:辞書やコーパス
  • 1-4 評価:評価尺度とエラー分析
  • 1-5 フロー:自然言語処理システムの開発サイクル
  • 1-6 まとめ

第2章 分類・回帰問題の解き方

  • 2-1 評価極性分析:ポジネガを判定する
  • 2-2 文書分類:記事の自動分類
  • 2-3 文章の品質推定:人手で書いた文章の品質を推定する
  • 2-4 演習:品質推定
  • 2-5 まとめ

第3章 系列ラベリング問題の解き方

  • 3-1 固有表現認識:固有表現を見つける
  • 3-2 形態素解析:単語分割・品詞推定・見出し語化
  • 3-3 誤り検出:誤り箇所の検出と訂正
  • 3-4 演習:文法誤り検出・訂正
  • 3-5 まとめ

第4章 言語生成問題の解き方

  • 4-1 文書要約:長い文章の要点をまとめる
  • 4-2 機械翻訳:同じ意味の別の言語で表現する
  • 4-3 対話:チャットのやり取りをする
  • 4-4 演習:機械翻訳
  • 4-5 まとめ

第5章 言語資源のつくり方

  • 5-1 言語資源の入手方法
  • 5-2 言語資源構築のデザイン:継続的な品質管理
  • 5-3 辞書作成
  • 5-4 コーパス作成
  • 5-5 ツールキット作成
  • 5-6 演習:フレーズ分類ラベルアノテーション
  • 5-7 まとめ
  • 参考文献
  • 関連論文

著者プロフィール

小町守(こまちまもる)

2005年東京大学教養学部基礎科学科科学史科学哲学分科卒業。2010年奈良先端科学技術大学院大学情報科学研究科博士後期課程修了。博士(工学)。在学中,Microsoft ResearchやAppleなどで研究開発に携わる。同年奈良先端大助教,2013年首都大学東京(現東京都立大学)システムデザイン学部准教授および教授を経て,2023年より一橋大学大学院ソーシャル・データサイエンス研究科教授。2023〜2024年ケンブリッジ大学客員研究員。

最近は深層学習を用いた自然言語処理の研究に取り組んでいる。『自然言語処理の基本と技術』(翔泳社,2016)監修。