これはPython Advent Calendar 2014の16日目です。 実践 機械学習システムを読んでいて画像のパターン認識が面白そうだったので実装して遊んでみました。主に10章のコンピュータビジョンと3章のクラスタリングを参考にしました。ほとんど、NumPyやscikit-learn、Mahotasに丸投げです。 ざっくりとした流れ 今回は用意した複数のjpg画像を教師無しでカテゴライズしてみました。 まず、全ての画像を局所特徴量リストにしました。局所特徴量にはSURFを使用しました。SURFはMahotasのmahotas.features.surf.surfで簡単に取得できます。 そして、すべてのSURFをk-means法でグループ化して基本特徴量(visual word)を求めます。k-means法の計算はsklearn.cluster.KMeans.fitを呼ぶだけでできま
![Pythonで画像の簡単なカテゴリ分け - Inside Closure - にへろぐ](https://cdn-ak-scissors.b.st-hatena.com/image/square/1625d7bd7dd20afda9eb128fbca2c94bf2a0eb1d/height=288;version=1;width=512/https%3A%2F%2Fcdn.image.st-hatena.com%2Fimage%2Fscale%2F3d37c68b801aa8374cac74fe4716995e802af7b7%2Fbackend%3Dimagemagick%3Bversion%3D1%3Bwidth%3D1300%2Fhttp%253A%252F%252Fhatenablog.com%252Fimages%252Ftheme%252Fog-image-1500.gif)