日本計算機統計学会 スタディーグループ 「IR(Institutional Research)のための統計的モデル構築に関する研究」ワークショップ 開催日時:2019年3月23日(土) 13:30~17:00 会場: 統計数理研究所 セミナー室1 Read less
![トピックモデルの基礎と応用](https://cdn-ak-scissors.b.st-hatena.com/image/square/96b05e48b5b2c746e365edcea3ea5c2cac0bca45/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2Ftopicmodeling-190324150834-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)
前回、疎行列をクラスタリングする話を書きました。 wanko-sato.hatenablog.com そこでふと思いついたのが、「数字の羅列を単語の集合とみなして自然言語処理のスキームに当てはめられるんじゃね?」ということです。どういうことかというと、 [[1]] [1] 246 308 149 170 161 233 291 218 260 171 155 151 [[2]] [1] 383 331 353 [[3]] [1] 310 333 [[4]] [1] 255 247 223 284こんな感じのデータがあるとします。個々の数字はなんでも良いのですが、例えばこれがある消費者の買った商品IDの集合だとします。通常は、前回書いたとおり、これを主成分分析にかけたり、クラスタリングしたり、あるいはあらかじめ属性がわかっていれば教師あり学習させてみたり、といろいろ思いつくわけなんです。が、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く