今回は,
近接検索の利用価値
「ある文字列"A"の近くに特定の文字列"B"が存在する」
"A" AND "B"
このようなAND演算子を使った全文検索では,
では,
DIALOGというオンライン情報検索システムがあります。18年くらい前に大学の図書館で,
Z39. 50を参考に
FINDSPOTの商用化段階の開発を行っていた時に,
- ※ WAISという検索システムではZ39.
50のプロトコルを使って情報の検索を行っています。
この規格には,
- 距離
- 2つのオペランドの位置を表す順序の差
- 関係
- 未満,
以下, 等しい, 以上, より大 - 単位
- 文字,
語, 文, 段落, 節, 章, 文書, 要素, 部分要素, 要素型, バイト, 私的に定義された単位 - 順序フラグ
- これがセットされた場合,
"右方"近接だけとなる - 除外フラグ
- これがセットされると,
演算にNOTが適用される
FINDSPOTの近接検索機能
FINDSPOTの近接検索機能を設計する際には,
FINDSPOTでは,
距離については,
除外フラグについては,