概要
最新版Apaceh Solr Ver.4.5.1に対応するため大幅な書き直しと原稿の追加を行い,現在の開発環境に合わせて完全にアップデートしました。Apache Solrは多様なプログラミング言語に対応した全文検索エンジンです。システムに検索機能を実装することは,自社の情報資産を守ることと,活用することその両方を一挙に実現します。そのためApache Solrを自社の情報資産活用に使うことが注目されています。本書は,Solrの基本機能を原理としくみから詳しく紹介し,どのようにSolrを実装していくか豊富なサンプルとともに解説を行います。
こんな方におすすめ
- 検索システムに興味のある方。前提として,JavaScriptやPHP,Javaなどのプログラミング経験がある方
著者から一言
本書は,情報検索に興味を持つ,あらゆる人を対象としています。学生から社会人,週末プログラマから職業プログラマ,SE,プログラミングをしない情報システムを使うだけの人,検索エンジンを比較検討しようとしている人……制限はありません。それぞれの立場でSolr をお楽しみください。しかしながら,本書はSolr の技術解説書でもあり,Solr をインストールしたりサンプルコードを設定したりする場面もあります。そのときは技術的なバックグラウンドのある方は若干有利でしょう。自分の経験に感謝しつつ,コマンドを入力したり,検索して結果を確認したり,より深くお楽しみください。
サンプルコードのダウンロードと本書のサポート
本書で紹介しているサンプルプログラムや設定ファイルは,技術評論社のホームページをはじめ,執筆陣が勤務する下記の会社のホームページからダウンロードできます。
本書の執筆には万全を期しましたが,ソフトウェア同様,残念ながら不具合が紛れ込む可能性があります。万一誤りを発見したり,手順どおり試したのに動かないことなどがありましたら,上記ホームページの問い合わせフォームなどからお気軽にご連絡ください。また,下記ブログのコメント欄でも受け付けます。
いただいた問い合わせには,個別に回答したり,ブログの記事上で回答したり,正誤表を作成したりなど,何らかの対応をしたいと思います。なお対応には時間がかかる場合がありますので,あらかじめご了承ください。
目次
第1章 イントロダクション
Apache Solrとはどのような検索エンジンなのかその特徴を述べ,次に全文検索の基礎知識である転置索引と転置索引を使った検索について説明します。インストールして実行する方法を,次にアーキテクチャを説明します。
第2章 スキーマの設定
Solrのインデックスは,RDBのテーブルの「カラム」に相当する「フィールド」で構成されています。インデックスがどのような型のフィールドで構成されているかという定義は,Solrのスキーマ定義ファイルで設定を行います。
第3章 インデックスの作成
Solrのインデックスの作成,更新の方法,それにかかわる設定や属性について学びます。
第4章 検索する
Solrで,どういった検索が行えるのか(検索式の書き方,ソートの指定方法,取得件数指定方法など),検索の付加機能(ファセット,ハイライト機能,キャッシュ)にどういったものが用意されているのかについて説明していきます。
第5章 クライアントプログラミング
いろいろなプログラミング言語によるSolrサーバへのアクセス方法について学んでいきます。共通の機能を持ったサンプルアプリケーションについてプログラミング言語ごとに説明していきます。
第6章 データのクローリング
検索対象文書のデータクローリングとして,データベースやRSSフィードなどのXMLファイルをSolrに取り込む「データインポートハンドラ(DIH)」機能や,Solrと親和性が高く,ファイルサーバやCMSをクロールしてSolrに取り込むことができる「Apache ManifoldCF」を紹介します。
第7章 より高度な検索
Solrのより高度な検索について学びます。本章前半では,Solrの「サーチコンポーネント」という機能を用いて,検索結果のランキングを調整したり,検索結果にさまざまな関連情報を付加する方法について学びます。
第8章 クラスタ構築と運用
分散インデックス・分散検索とレプリケーションを用いた検索クラスタとSolr4.0から新たに追加されたSolrCloud を用いた検索クラスタの構築および運用方法を紹介します。
第9章 開発および運用のTIPS
Solrを実際のサービスで利用しているリクルートにおける開発・運用上の経験を,TIPSとして紹介します。
Appendix
スキーマ操作/マルチコア操作/コレクション操作について紹介します。