WEB+DB PRESS plusシリーズ日本語入力を支える技術
―変わり続けるコンピュータと言葉の世界
2012年2月8日紙版発売
2014年12月10日電子版発売
徳永拓之 著
A5判/320ページ
定価2,827円(本体2,570円+税10%)
ISBN 978-4-7741-4993-6
ただいま弊社在庫はございません。
書籍の概要
この本の概要
コンピュータと人を結ぶ窓口である入力プログラム(IME)は一見シンプルですが,その言語,特に日本語の扱いにはソフトウェアレベルの数多くの工夫が詰まっています。本書では,いまどきの日本語入力システムで利用されている変換アルゴリズムや機械学習といった技術を紐解きます。また,かな漢字変換エンジンの実装を通じて,いかにして変換精度を向上させるか,効率よく日本語を入力するかを丁寧に解説。広くソフトウェア開発者,プログラマの方々へ,新たな技術が続々と取り込まれているIMEのいま知っておきたい基本を紹介します。
こんな方におすすめ
- 日本語入力ソフトの仕組みや実装に興味のある方
- 自然言語処理のアルゴリズムやデータ構造に興味のあるプログラマ
著者の一言
日本語入力というのは日本語を使う人にとっては非常に重要な機能ですが,その中身は意外と知られていません。特に,90年代後半以降では統計・機械学習の分野の技術が取り入れられてきましたが,そういったトレンドについて,これまで専門家以外に向けてあまり詳しい解説がありませんでした。
本書では,日本語入力,その中でも特にかな漢字変換について,どうやって作るのかをサンプルコードなどを用いながら噛み砕いて紹介しました。プログラミングを一通り覚えた方であれば実際にプログラムが書けることを目指しました。
本書で紹介したダブル配列やLOUDSといったデータ構造や,条件付き確率場や構造化SVMといった機械学習アルゴリズムは,日本語入力のみならず,読者の方がさまざまなプログラミングの機会に応用が効くものと信じています。日本語入力に興味がある方にはもちろんですが,自然言語処理や機械学習に興味があって一度具体的な応用に触れてみたい,という人にもぜひ読んでいただきたいと考えています。
本書に関するお知らせ
本書に関連する記事を公開しております。
この書籍に関連する記事があります!
- はじめに
- 本書は,コンピュータで日本語を入力する際に必要となるソフトウェアについての本です。
- 新たな技術が続々と取り込まれている日本語入力のいま
- みなさんは日々,パソコン,携帯電話,スマートフォンなどで日本語の入力を行っていることと思いますが,それがどのようなしくみでできているのか,考えてみたことはありますか?
この本に関連する書籍
-
[改訂新版]プログラマのための文字コード技術入門
ソフトウェアエンジニアをおもな対象に,文字コードの基本をまとめた解説書。 本書前半では,「文字」そのものと「文字コード」の歴史を少しずつ解きほぐしながら,...
-
正規表現技術入門 ――最新エンジン実装と理論的背景
最先端の正規表現技術にスポットを当てた,初学者向け技術解説書。プログラマにとって欠かせないツールである正規表現。便利な正規表現の実力を発揮させるには,動作原...
-
検索エンジン自作入門 ~手を動かしながら見渡す検索の舞台裏
まいにち使っている検索エンジンがどうやって動いているか,知っていますか? 本書では,小さな検索エンジンを作りながら,ソースコードレベルで検索エンジンのしくみ...
-
良いコードを書く技術 ― 読みやすく保守しやすいプログラミング作法
読みやすく保守しやすい「良いコード」の書き方を解説した入門書です。『WEB+DB PRESS』で断トツ人気だった連載を加筆・修正して書籍化しました。 本書を読むと,良い...
-
オンラインゲームを支える技術 ―壮大なプレイ空間の舞台裏
オンラインゲームをテーマとした技術解説書。 ソフトウェア開発において,オンラインゲーム開発者は卓越した技術力を持つ専門性の高い花形と言われています。そこでは...
-
プログラマのための文字コード技術入門
より深く知り,すぐ試し,上手に実装したい。プロの道を進む方々にお届けしたい「ベーシック」,WEB+DB PRESS plusシリーズ「技術入門」の第1弾です。 コンピュータ...