scikit-learn (読み方は「サイキット・ラーン」) は、Python の機械学習 (Machine Learning; マシン・ラーニング) のモジュールです。 scikit-learn は以下のような特徴があります。 NumPy, SciPy や Matplotlib と互換性を持つように開発されています。例えば、NumPy で作成した行列を機械学習の入力データとして扱うことができます。 オープンソース (BSD ライセンス) で公開されており、無料で利用できるだけでなく、商用にも利用可能です。 クラスタリングや回帰、分類器、次元圧縮、データの前処理をはじめとする、機械学習のアルゴリズムを幅広く実装しています。 このサイトでは、データを用いて、いくつかの機械学習を用いたデータ分析を実行するための手順を紹介します。 scikit-learn で決定木分析 (Decision Tr