これはPython Advent Calendar 2014の16日目です。 実践 機械学習システムを読んでいて画像のパターン認識が面白そうだったので実装して遊んでみました。主に10章のコンピュータビジョンと3章のクラスタリングを参考にしました。ほとんど、NumPyやscikit-learn、Mahotasに丸投げです。 ざっくりとした流れ 今回は用意した複数のjpg画像を教師無しでカテゴライズしてみました。 まず、全ての画像を局所特徴量リストにしました。局所特徴量にはSURFを使用しました。SURFはMahotasのmahotas.features.surf.surfで簡単に取得できます。 そして、すべてのSURFをk-means法でグループ化して基本特徴量(visual word)を求めます。k-means法の計算はsklearn.cluster.KMeans.fitを呼ぶだけでできま
![Pythonで画像の簡単なカテゴリ分け - Inside Closure - にへろぐ](https://cdn-ak-scissors.b.st-hatena.com/image/square/5e7bbb0efbac1e73fd47c9fe5d4cac092ef68957/height=288;version=1;width=512/http%3A%2F%2Fhatenablog.com%2Fimages%2Ftheme%2Fog-image-1500.gif)