タグ

2015年6月2日のブックマーク (4件)

  • レコメンドなどで使われる類似度計算をRubyで自動化 - Qiita

    レコメンドやデータ分析に使われることも多い類似度計算を簡単にできるmoduleを作りました。 対応している類似度は以下の3つ。 コサイン類似度 JacCard係数 Dice係数 多少汎用的に算出ができるように、配列とハッシュに対応。 ① 二つの配列を渡すと類似度が返ってくる ② 二つのハッシュを渡すと類似度が返ってくる ③ モデルとカラムを渡せば類似度を全てのレコードの組み合わせの類似度を算出してくれる(未完成) ※③は、例えばUserテーブルを持っていたとしたら、Userというクラス名と、Userモデルから取得できるデータやカラム名と重みを渡すだけで、user-user全ての類似度を算出してくれたら便利だなと思って作ってみました。 ①、②については以下のsimilarity_generator.rbで算出できる module SimilarityGenerator #data1,data

    レコメンドなどで使われる類似度計算をRubyで自動化 - Qiita
    h5y1m141
    h5y1m141 2015/06/02
    ”レコメンドなどで使われる類似度計算をRubyで自動化”
  • SimStringをRubyから使ってみた - #詰んでる日記

    SimStringは,類似文字列検索のための高速かつシンプルなライブラリです。 簡単にいえば「もしかして:〇〇」を簡単に実装できるライブラリですね。 詳しくは公式サイトを見てください。http://www.chokkan.org/software/simstring/ このライブラリはC++でできているのですが、公式サイトを見るとPythonRubyからも扱えるとのこと。Pythonのサンプルが載っていて普段ならこれでなんの問題もないのですが、最近仕事RubyをやっているのでRubyから使う方法が知りたくて調べました。 ビルド方法 基的には公式サイトの手順で問題ないのですが、注意点が少し有ります。 Ruby1.9系はインストール出来ない Macだとインストールはできるが、なんか動かない(っぽい) CentOS5.5にruby1.8.7だとあっさりできました。 データ投入 一番簡単なの

    SimStringをRubyから使ってみた - #詰んでる日記
    h5y1m141
    h5y1m141 2015/06/02
    類似文字列検索のライブラリでSimStringっていうのがあるらしくそれをRubyから使う時のサンプルだけど2010年の情報だから今だと何か違うのがありそう
  • GitHub - ttezel/bayes: Naive-Bayes Classifier for node.js

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - ttezel/bayes: Naive-Bayes Classifier for node.js
    h5y1m141
    h5y1m141 2015/06/02
    A Naive-Bayes classifier for node.jsってこっちのほうが自分的には使い勝手あるかも
  • naive bayes

    naive-bayes.rb Ѕ� �U pw# �U class Classifier def initialize @features = {} # { "height_2" => { body_img => 10, spam_img => 2 } } @categories = {} # { body_img => 8, spam_img => 2 } @thresholds = {} end def set_threshold(category, threshold) @thresholds[category] = threshold end # features = {"http:"=>1, "あわせて"=>1, "読"=>1, "img.awasete.com"=>1, "width_125"=>1, "height_125"=>1, "ブログパーツ"=>1, "みたい"=>1

    naive bayes
    h5y1m141
    h5y1m141 2015/06/02
    書籍「集合知プログラミング」の6章ドキュメントフィルタリングのPythonのやつをRubyに書き換えたやつ。だいぶ古いけど参考になるはず。