記事を非公開にしてたけど,いま少し頑張っていることを書くことにする. マルチラベル分類 従来の分類問題は一つのデータ点(インスタンス)は一つのクラスのいずれかに属するという設定. マルチラベル分類は一つのインスタンスが一つ以上のクラスに属するという設定. 割り当てがラベルの組み合わせの数だけ存在するので比較的難しいよねという話.(おおざっぱにいえば マルチラベル分類のライブラリ 色んなところで色んな人が公開している. 有名なのは Mulan http://mulan.sourceforge.net/ MEKA http://meka.sourceforge.net/ 特にMulanはデータセットを公開しているので(arff形式だが)非常によく引用されている. これらはJavaのWekaというデータマイニングライブラリをベースに実装されている. しかし一方で,個人がいろいろと公開しているもの