タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

機械学習とstanに関するxiangzeのブックマーク (4)

  • 関係データ学習の実装 ツイッターデータのスペクトルクラスタリングとSBM - やったことの説明

    概要 関係データ学習の学習のために,自分で実装して理解する. ツイッターのフォローフォロワー関係を使って,グラフラプラシアンを求めスペクトルクラスタリングを行った. その結果,なんとなくクラスタリングできた. また,確率的ブロックモデルによる非対称データクラスタリングをStanによって実装しようとした. これはうまくいっていない. はじめに 関係データ学習というを買って読んでいる. www.kspub.co.jp の内容は前半と後半に分かれていて,前半は関係データをスペクトルクラスタリングしたり,確率的ブロックモデルでクラスタリングしたりする話.後半は行列分解やテンソル分解の話になっている. まだ前半の途中までしか読めていないが,予想していたよりも数式が簡単だったこともあり,実際のデータに適用してみたくなった. 数年前に書いたツイッターのフォローフォロワー関係をダウンロードするスクリプ

    関係データ学習の実装 ツイッターデータのスペクトルクラスタリングとSBM - やったことの説明
  • Bayesian GPLVMをStanで実装してみた - StatModeling Memorandum

    この記事の続きです。PRML下の12章に出てくるOil Flowのデータ(データ点1000個×特徴量12個)に対してBayesian GPLVMで2次元(または3次元)の潜在変数空間にマッピングして綺麗に分離されるか見てみます。 まずはPRMLにもあるように普通の主成分分析でやると以下になります。綺麗には分離されません。 次にBayesian GPLVMでやってみます。Stanコードは以下になります。 2~4行目: N・K・Dはそれぞれ、データ点の数・特徴量の数・最終的に落とし込む潜在空間の次元です。 14行目: 潜在変数です。 15行目: カーネルに含まれるパラメータです。僕が理解したところだと特徴量ごとにガウス過程が存在するのでKごとに異なる値を持つようにしています。→ 2017.07.02追記 Kごとに異なる値にするのではなく、1つだけにし、スケーリングしてから適用することで情報を圧

    Bayesian GPLVMをStanで実装してみた - StatModeling Memorandum
  • オンライン広告の数理モデルと数学ソフトウェア MSFD#23 - Speaker Deck

    All slide content and descriptions are owned by their creators.

    オンライン広告の数理モデルと数学ソフトウェア MSFD#23 - Speaker Deck
  • Stan Math Libraryでディリクレ分布からサンプルする - wildpieの日記

    はじめに C++から使うことのできるStan Math Libraryには、統計や機械学習で使う数学の関数が多数実装されています。このライブラリを使って、ディリクレ分布からサンプリングしてみました。 必要なソフト Stan Math Library(stan-dev/math · GitHub) Eigen(Eigen) Boost(Boost C++ Libraries) ちなみにStan Math Libraryはnew BSD licenseです。 コンパイラはVisual Studio 2012を使用したのですが、erf()などが未定義とのエラーになりました。erf()はVisual Studio 2015では標準で対応しているので、今回はVisual Studio 2015を使用しています。 とはいえ、それでもエラーがいくつかでました。double smallの変数名を変えるのと

    Stan Math Libraryでディリクレ分布からサンプルする - wildpieの日記
  • 1