先週のうちのチームの論文輪読会でこの論文を読んだので、その時用いた資料を一部改訂して上げておきます。いつも通り炎上ラーニング大歓迎*1なので、おかしなところがあったらどんどん突っ込んで下さると有難いです。 Online chinese restaurant process - ACM Digital Library 何とビデオレクチャーということで、去年のNYCでのKDDの本番トークそのものがまんま収録されて公開されてるんですね~。ということで論文読みながら*2このトークを改めて聴くのも良いかも。 0 全体要約 読んで字の如し、混合ディリクレ過程(Dirichlet Process Mixture)をオンライン化しようという論文。大規模データであればあるほどクラスタリングする際にクラスタ数が事前に分かっているケースは少ないのでDPMが大事になってくるが、当然のように大規模になるほどバッチで
![Online Chinese Restaurant Process (Liu et al., KDD 2014) メモランダム - 銀座で働くデータサイエンティストのブログ](https://cdn-ak-scissors.b.st-hatena.com/image/square/5d1a135ca9048f4a942fcb45b755a01578c9f93c/height=288;version=1;width=512/http%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2FT%2FTJO%2F20150417%2F20150417170922.png)