Ctransのブックマーク - はてなブックマーク

Ctrans id:Ctrans

ブックマーク / www.ipsj.or.jp (1)

高速な類似文字列検索アルゴリズム岡崎直観 † 辻井潤一 †‡ † 東京大学大学院情報学環 ‡ 英国マンチェスター大学英国国立テキストマイニングセンター 1 はじめに類似文字列検��
高速な類似文字列検索アルゴリズム岡崎直観 † 辻井潤一 †‡ † 東京大学大学院情報学環 ‡ 英国マンチェスター大学英国国立テキストマイニングセンター 1 はじめに類似文字列検索は，文字列集合の中から検索クエリ文字列に似ている文字列を見つけるタスクであり，柔軟な辞書引き，スペル訂正，重複レコード検出など，様々なアプリケーションにおいて必須の技術である．本発表では，「文字列の集合 V の中で，検索クエリ文字列 x と類似度が α 以上の文字列を全て見つけ出す操作」を，類似文字列検索と定義する．この操作は，V の部分集合 Yx,α を求める問題として定式化できる． Yx,α = {y ∈ V sim(x, y) ≥ α} (1) ここで，sim(x, y) は文字列 x と y の類似度を与える関数（類似度関数）である．この問題は，ある検索クエリ文字列 x と集合に含
Ctrans 2011/08/11
高速な類似文字列検索アルゴリズム

PDF
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx