kampersanda.hatenablog.jp[B!]新着記事・評価 - はてなブックマーク

『kampersanda.hatenablog.jp』

SIF/uSIFを使ってRustで簡単高速文埋め込み - Kampersandaのブログ
17 users
kampersanda.hatenablog.jp

本記事は、情報検索・検索技術 Advent Calendar 2023 9日目の記事です。 SIF/uSIFという文埋め込み手法と、そのRust実装であるsif-embeddingを紹介します。最後にちょこっとベクトル検索もします。はじめに SIF SIF-weighting Common Component Removal アルゴリズム使用上の注意 uSIF sif-embedding 準備単語埋め込みの準備ユニグラム言語モデルの準備 Let's 文埋め込み性能評価速度性能評価用データセットを使ったベンチマーク英語日本語ベクトル検索おわりにはじめに自然言語文の密ベクトル表現を文埋め込みと呼びます。文埋め込み同士のコサイン類似度などを使って、文同士の意味的な類似度が計算できるので、自然言語処理や情報検索などで重宝します。特に最近では、今年のAdvent Calen
- テクノロジー
- 2023/12/09 15:32
- Rust
- あとで読む
- search
- techfeed

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx