Code Archive Skip to content Google About Google Privacy Terms
measuringmeasures.com 2024 著作権. 不許複製 プライバシーポリシー
PRML 14.5.1の混合正規回帰モデルのEMアルゴリズムによるパラメータ推定を実装してみた。 混合正規回帰モデルは下図のようなデータ点に対して 一本の直線でフィッティングする代わりに 複数の直線でフィッティングするというモデルである。 これは混合正規分布の推定と同じくEMアルゴリズムで推定できる。詳しくはPRMLの14.5.1を参照。 package chapter14; import java.util.Random; public class Main { static double generate(double x){ if(Math.abs(x) >= 0.5){ return - 0.5 * x - 1; }else{ return 0.5 * x + 1; } } public static void main(String[] args) throws Exceptio
GW 中の長距離移動のために体調が優れない takahi-i です. 今回は巨大なデータをマイニングする一つの技術として LSH (Localtiy Sensitive Hashing) を紹介させていただきます. LSH とは LSH は大量なデータから類似度が高いインスタンスのペアを高速に抽出してくれるアルゴリズムです. ここでインスタンスはデータ集合の一つの要素を表します. たとえば扱うデータが E-コマースサイトの購買ログであれば, インスタンスは各ユーザですし, 画像データ集合であれば, インスタンスは個々の画像データです. LSH の詳しい解説については以下のサイトがあります. Wikipedia のエントリ LSH に関する論文がまとめられているページ 本稿ではE-コマースサイトの購買履歴データを基に LSH の機能について述べてゆきます. 以下のような E-コマースサイトの
前回は、MUSASHIの出力結果をARFFフォーマットで出力する方法を紹介した。ARFFは高機能なデータマイニングツール"WEKA"が採用するデータフォーマットだ。今回はMUSASHIから出力したARFFファイルを、WEKAで実際に利用してみよう。 WEKAは"Machine Learning"、つまり直訳すると「機械学習」の研究と普及のために開発されているソフトウェアだ。機械学習は、コンピュータが経験したことを自動的に取り込み、以降の処理に活かしていくような人工知能的な情報処理の分野であり、データマイニングで利用されるアルゴリズムの多くは、機械学習に関する研究を取り入れたものだ。WEKAは多くの機械学習アルゴリズムを実装した、様々な用途に使える汎用的なシステムだが、今回はMUSASHIと組み合わせた可視化ツール、つまりビジュアライザとして使用する目的に絞って紹介しよう。 今回も、あらかじ
昔書いたことがあったけど、どこかにいってしまったのでもう一度書いてみた。推論方法にはギブスサンプリングと変分ベイズの2つがあるけど、導出も実装もより楽なcollapsed gibbs sampling(Griffiths and Steyvers, PNAS, 2004)の方を採用。 Token.java package lda; public class Token { public int docId; public int wordId; public Token(int d , int w){ docId = d; wordId = w; } } LDA.java package lda; import java.util.*; public class LDA { int D; // number of document int K; // number of topic int
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く