[B! spark] t_horieのブックマーク

t_horie id:t_horie

sparkに関するt_horieのブックマーク (5)

Sparkでコサイン類似度を求める - Qiita
たまに、レコードが持つ変数間でコサイン類似度を計算したい時があるので、備忘として書いておくなお、以下の例で扱うデータは、適当なIDと紐づけられたベクトルをもつデータフレームとする。 from pyspark.mllib.linalg import Vectors data = sc.parallelize([ ("a", Vectors.dense([0, 1, 2])), ("b", Vectors.dense([3, 4, 5])), ("c", Vectors.dense([6, 7, 8])) ]).toDF(["id", "features"]) # 適当に交差結合で組み合わせデータ _data = data.select(col("id").alias("_id"), col("features").alias("_features")) tgt_data = data.cr
t_horie 2021/07/18
コサイン類似度総当り

spark

ml
リンク
https://github.com/apache/spark/blob/master/mllib/src/main/scala/org/apache/spark/ml/recommendation/ALS.scala
t_horie 2021/07/18
ALSのコード

ml

spark
リンク
How to get cosine similarity scores for all users and all the items in PySpark, if user's and item's embeddings are given?
t_horie 2021/07/18
コサイン類似度すべて返す

ml

spark
リンク
Join two Spark mllib pipelines together
t_horie 2021/07/17
pysparkでのfeatureunion実装

ml

spark
リンク
Extracting, transforming and selecting features - Spark 3.5.1 Documentation
t_horie 2021/07/17
ML

spark
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx