[B! 形態素解析][Oracle Database] oracletechnologynetworkのブックマーク

oracletechnologynetwork id:oracletechnologynetwork

形態素解析とOracle Databaseに関するoracletechnologynetworkのブックマーク (1)

SQLで高速にあいまい検索してみよう：ベンチャー社長で技術者で：エンジニアライフ
株式会社ジーワンシステムの代表取締役。新しいものを生み出して世の中をあっといわせたい。イノベーションってやつ起こせたらいいな。リクエストがあったので、OracleでN-Gram（今回は2-Gram バイグラム）で顧客を抽出するSQL＆ストアドプロシージャを作ってみました。全文検索ではありますが、Googleなどであればキーワードとキー（GoogleはURL）ごとにあらかじめスコアリングしています。それで、実際には上から×××件（スコアーの低いコンテンツは無視され漏れる）という仕組みになりますが、50万人ぐらいの顧客の中から、特定の顧客を特定するような処理であれば、スコアリングはできないし漏れることはマズイのでそれほど高速にはできません。たかだか50万件ではもともと速いから、パフォーマンス的にはあまり効果はないかも。また、N-Gramは、ゴミを拾い易い検索方式ですが、チューニングしだ
oracletechnologynetwork 2009/08/07
Oracle

Oracle Database

Oracle Database XE

Oracle Text

全文検索

検索エンジン

N-Gram

形態素解析
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx