コサイン類似度に基づくソート処理の実装方法とその性能比較

テクノロジーカテゴリーの変更を依頼記事元:

pgsqldeepdive.blogspot.com

54 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

mooz MADlib や sklearn で UDF

2017/01/24 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

コサイン類似度に基づくソート処理の実装方法とその性能比較

文書の類似度を計算する方法に「コサイン類似度」を用いる方法があります。これは、出現する単語を出現... 文書の類似度を計算する方法に「コサイン類似度」を用いる方法があります。これは、出現する単語を出現回数などで数値化して、空間ベクトルに変換した上でベクトル同士の類似度を計算する、という手法です。コサイン類似度 http://www.cse.kyoto-su.ac.jp/~g0846020/keywords/cosinSimilarity.html 最近、このコサイン類似度を使って、似ているデータを検索するWebアプリを試しに作っていたのですが、ふと、「このコサイン類似度を使ったソート処理をPostgreSQLでどのように実装するともっとも高速な実装になるのだろうか。また、現実的なパフォーマンスを考えた時にデータ量や次元のサイズはどこまで増やせるのだろうか」ということが気になりました。 PostgreSQLは、その拡張性の高さがウリの一つですが、そのため「UDFを作る」ということを考え

ブックマークしたユーザー

techtech05212024/01/09
daitom2020/05/03
nashcft2017/01/29
lumely2017/01/26
ainame2017/01/26
InoHiro2017/01/25
terazzo2017/01/25
somathor2017/01/25
miyakawa_taku2017/01/25
Tomato-3602017/01/25
masa21kik2017/01/25
octweb2017/01/25
seneca2017/01/25
hidelocal2017/01/24
mooz2017/01/24
ropponzo2017/01/24
m0t0m0t02017/01/24
clavier2017/01/24

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx