本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 こんにちは、アナリティクスサービス部の辻 陽行です。 今回は、データ分析を行う際のデータの前処理や集計を行う時に非常に役に立つ、PandasというPythonの便利なモジュールを紹介したいと思います。 モジュールを紹介する前に、分析作業の流れとPandasがどのあたりに関与してくるかを先に説明しておきます。 私たちの仕事は、さまざまなデータ分析をお客さまへ提供し、それを付加価値の核としているわけですが、 行き当たりばったりでデータを分析していくのでは、到底価値のある結果を導きだすことはできません。 大抵の場合、以下の手順に沿って分析を進めていくことになります。 データ分析のフロー ヒアリング・仮説形成 (お客さまからの)データ受領 データの前処理・整形 基礎集計 仮説の修正・分析方針の再検
![Pandasを用いた基礎分析 - Platinum Data Blog by BrainPad ブレインパッド](https://cdn-ak-scissors.b.st-hatena.com/image/square/bb0716ce75b0b0754cf7d9cea6579ff6b451588f/height=288;version=1;width=512/https%3A%2F%2Fcdn.image.st-hatena.com%2Fimage%2Fscale%2F26b7f01d3e39258e0ce31267d1e6ab8c23b9b430%2Fbackend%3Dimagemagick%3Bheight%3D1300%3Bversion%3D1%3Bwidth%3D1300%2Fhttp%253A%252F%252Fcdn-ak.f.st-hatena.com%252Fimages%252Ffotolife%252Fb%252Fbp-writer%252F20141117%252F20141117181316.png)