[B! ベクトル空間] santhiagomanのブックマーク

santhiagoman id:santhiagoman

ベクトル空間に関するsanthiagomanのブックマーク (1)

潜在的意味インデキシング（LSI）徹底入門
LSI については「特異値分解とLSIの意味」でも触れたことがありますが、この時はまだ理解不足だったので改めて解説したいと思います。 LSI (Latent Semantic Indexing) 1は検索などに用いられる次元圧縮手法です。例えば、「車で行く」と「自動車で行く」は意味として全く同じですが、単語そのものを見ると「車」と「自動車」が異なるため違う文として扱われてしまい、「車」で検索しても「自動車で行く」という文がヒットしません。しかし、「車」も「自動車」も同じ意味なので同じ文として扱われるようにしたいですよね。これを実現する手法の1つが LSI です。ベクトル空間モデル LSI では Bag of Words によるベクトル空間モデルが使用されます。要は単語の出現順を考慮せず、単語の出現頻度などによって文書をベクトルで表現するモデルです。例えば次の4つの文書があったと
santhiagoman 2016/10/11
ベクトル空間
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx