こんにちは。検索グループ解析チームの nabokov7 です。 今回は、ライブドアLislogというサービスのデータをちょっと拝借して、「クラスタリング」という解析手法を紹介したいと思います。 ちなみにこの Lislog というサービスは,ぱっと見ただの投票サービスのようですが (実際そういう使い方もできるんですが),ユーザ一人一人がどれかひとつのアイテムに投票するのではなく,各ユーザが自分なりの「俺的○○ベスト10」や「俺的○○の10のリスト」などを公開・共有し,その結果「全体の人気ランキング」が集計される,という点で通常の投票サイトとは少し違っています。 (従って,リスログの「全体のランキング」とはただの投票数ランキングではなく,「より多くのユーザのリストで高いランクになったアイテムほど,全体のランキングでも上位になる」というアルゴリズムになっています。) ここへクラスタリングを導入す