タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

*algorithmとrustとrepに関するsh19910711のブックマーク (1)

  • SIF/uSIFを使ってRustで簡単高速文埋め込み - たまに書く

    記事は、情報検索・検索技術 Advent Calendar 2023 9日目の記事です。 SIF/uSIFという文埋め込み手法と、そのRust実装であるsif-embeddingを紹介します。最後にちょこっとベクトル検索もします。 はじめに SIF SIF-weighting Common Component Removal アルゴリズム 使用上の注意 uSIF sif-embedding 準備 単語埋め込みの準備 ユニグラム言語モデルの準備 Let's 文埋め込み 性能評価 速度性能 評価用データセットを使ったベンチマーク 英語語 ベクトル検索 おわりに はじめに 自然言語文の密ベクトル表現を文埋め込みと呼びます。文埋め込み同士のコサイン類似度などを使って、文同士の意味的な類似度が計算できるので、自然言語処理や情報検索などで重宝します。特に最近では、今年のAdvent Calen

    SIF/uSIFを使ってRustで簡単高速文埋め込み - たまに書く
    sh19910711
    sh19910711 2024/02/23
    "SIF: 文埋め込み + ICLR 2017で発表 / CCR: 文埋め込みから文法に関係する成分を取り除く + "just", "when", "even", "one"などの構文情報に関係する単語 + このような成分を、文の意味には寄与しないノイズとして取り除く" / 2023
  • 1