はじめに データ分析が必要な局面がぼちぼち出てきましたので、まずは簡単な決定木を用いて 分析結果の可視化をしようじゃないか、というのが今回の目論見です。 決定木とは 決定木とは、scikit-learnの1.8. Decision Treesによると、 分類や回帰を行うために使われる、ノンパラメトリックな教師あり学習のひとつ、とあります。 また、目的は、学習データ中の特徴(説明変数)を用いて、目的変数の推測を行えるモデルを作ること、だそうです。 ナンノコッチャ?ですので例を挙げますと、例えばある有料サービスに申し込んでくれる人を増やすために、 今までの履歴からどういったお客様が有料サービスに申し込んでくれたか、を調査するとします。 無料サービスA, B, Cがあったとして、どれとどれをどのくらい使っている人が 有料サービスを申し込んでくれるか、こういうことを考えたいわけですね。 ここで言う
![Pythonで決定木を描いてみる - 技術情報棚卸し(平日限定)](https://cdn-ak-scissors.b.st-hatena.com/image/square/7c74f6ae802c4757d73d37e80163069dfbb67576/height=288;version=1;width=512/http%3A%2F%2Ftodoa2c.github.io%2Fimages%2Fcontents%2F20140812-default-tree.png)