はじめに データ分析実務において、前処理や集計・可視化後によく行う分析手法をまとめました 前処理編とデータ集計・可視化編の続きです ここでいう「実務」とは機械学習やソリューション開発ではなく、アドホックなデータ分析や機械学習の適用に向けた検証(いわゆるPoC)を指します 領域によっては頻繁に使う手法は異なるかと思うので、自分と近しい領域のデータ分析をしている方の参考になればと思います 今回紹介する分析手法 パレート分析 線形回帰 時系列解析(季節成分分解) 時系列解析(時系列データの相関) ランダムフォレストによる特徴量の重要度 1. パレート分析 対象データ:カテゴリカルデータ 用途:各カテゴリの全体に対する構成比率 ケーススタディ:製品カテゴリ別の売上データ(A~H)に対して、各製品カテゴリの売上傾向を把握したい サンプルデータの生成 A = np.repeat('Cat_A', 15
![【厳選】Python実務データ分析でよく使う手法(分析手法編) - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/ac672eb640b98a96f8948936b7bbb0b75c516653/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9JUUzJTgwJTkwJUU1JThFJUIzJUU5JTgxJUI4JUUzJTgwJTkxUHl0aG9uJUU1JUFFJTlGJUU1JThCJTk5JUUzJTgzJTg3JUUzJTgzJUJDJUUzJTgyJUJGJUU1JTg4JTg2JUU2JTlFJTkwJUUzJTgxJUE3JUUzJTgyJTg4JUUzJTgxJThGJUU0JUJEJUJGJUUzJTgxJTg2JUU2JTg5JThCJUU2JUIzJTk1JUVGJUJDJTg4JUU1JTg4JTg2JUU2JTlFJTkwJUU2JTg5JThCJUU2JUIzJTk1JUU3JUI3JUE4JUVGJUJDJTg5JnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz0xZTQ3ODFiN2I5YWMxMTU1NjQyNzgxNGNlYjczMGE2Ng%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwdGFrdWJiJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz0zNmQ3NmNmOTMyOWU1NWMyMDM3YjVhZjI5MTNlN2FhYQ%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3Db0fa47030b94a7b941693d1db502da2f)