纏まった記事があまりなかったので、scikit-learnの使い方を纏めてみました。 scikit-learnはPythonで使える機械学習ライブラリで、読み方は「サイキットラーン」です。 本記事では教師あり学習を想定していますが、教師なし学習でも基本的には同じ流れになります。 また、scikit-learnやnumpyのインストールは既に済んでいるものとします。 データセットの用意 まずは、当たり前ですが、データセットを用意する必要があります。 書籍などではscikit-learn付属のデータセットを用いる場合が多いですが、日常の研究や業務では自分達で用意したCSVファイルを使うことが多いと思います。 その場合、numpyのloadtxt関数を使うと便利です。 例えば、1列目が目的変数、2列目以降が説明変数となる
![scikit-learn(sklearn)の使い方 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/36ca57396532bf6427dab5272cf0a5f71289e2aa/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9c2Npa2l0LWxlYXJuJUVGJUJDJTg4c2tsZWFybiVFRiVCQyU4OSVFMyU4MSVBRSVFNCVCRCVCRiVFMyU4MSU4NCVFNiU5NiVCOSZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnM9MmZhYmQ3ZmQzNmM3Y2M1OTNjMjQ0NTc1OWRlNDgyY2Y%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBrZW50YTE5ODQmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zNiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPTkxMjM3MmMyNDQzYWY4YThkZDkxYjc0YzliNDQyNWY3%26blend-x%3D142%26blend-y%3D436%26blend-mode%3Dnormal%26txt64%3DaW4g5qCq5byP5Lya56S-44Kw44Ot44O844OT44K5%26txt-width%3D770%26txt-clip%3Dend%252Cellipsis%26txt-color%3D%2523212121%26txt-font%3DHiragino%2520Sans%2520W6%26txt-size%3D36%26txt-x%3D156%26txt-y%3D536%26s%3D80b6820587fea88efbc36018f52236fd)