日本語入力を支える技術 ―変わり続けるコンピュータと言葉の世界
この本の概要
コンピュータと人を結ぶ窓口である入力プログラム(IME)は一見シンプルですが,その言語,特に日本語の扱いにはソフトウェアレベルの数多くの工夫が詰まっています。本書では,いまどきの日本語入力システムで利用されている変換アルゴリズムや機械学習といった技術を紐解きます。また,かな漢字変換エンジンの実装を通じて,いかにして変換精度を向上させるか,効率よく日本語を入力するかを丁寧に解説。広くソフトウェア開発者,プログラマの方々へ,新たな技術が続々と取り込まれているIMEのいま知っておきたい基本を紹介します。
こんな方におすすめ
- 日本語入力ソフトの仕組みや実装に興味のある方
- 自然言語処理のアルゴリズムやデータ構造に興味のあるプログラマ
著者からの一言
日本語入力というのは日本語を使う人にとっては非常に重要な機能ですが,その中身は意外と知られていません。特に,90年代後半以降では統計・機械学習の分野の技術が取り入れられてきましたが,そういったトレンドについて,これまで専門家以外に向けてあまり詳しい解説がありませんでした。
本書では,日本語入力,その中でも特にかな漢字変換について,どうやって作るのかをサンプルコードなどを用いながら噛み砕いて紹介しました。プログラミングを一通り覚えた方であれば実際にプログラムが書けることを目指しました。
本書で紹介したダブル配列やLOUDSといったデータ構造や,条件付き確率場や構造化SVMといった機械学習アルゴリズムは,日本語入力のみならず,読者の方がさまざまなプログラミングの機会に応用が効くものと信じています。日本語入力に興味がある方にはもちろんですが,自然言語処理や機械学習に興味があって一度具体的な応用に触れてみたい,という人にもぜひ読んでいただきたいと考えています。




