タグ

2008年2月21日のブックマーク (1件)

  • 視覚障害者のための読みがなによる全文検索システム、その提案と実装

    概要 記事では視覚障害者の利用を想定した、 漢字をふくむ日語文字列を読みがなだけで検索するシステムを提案する。 手法は bi-gram と動的計画法をもちいて、漢字を含む文字列を すべての可能な読み方で効率的にインデックス、および検索することを可能にする。 試験的な実装により、手法が大規模な文書検索に応用可能であること、 また純粋な読みがなだけの検索では不十分な場合があることを示す。 1. 背景 2. 基的な機構 2.1. 検索の流れ 3. インデクシングのアルゴリズム 4. マッチングのアルゴリズム 5. 辞書ファイルの最適化 6. 点字規則の追加 7. 評価実験 7.1. 実装 7.2. 実験に用いた文書集合 7.3. インデクシングの効率 7.4. 検索の効率 8. 残された課題 8.1. 検索結果のランキングおよびフィルタリング 8.2. 読みがな以外による表記のゆれ 8