秋山です。 機械学習やディープラーニングが流行っていますが、基本的には何をするにも大量のデータを取り扱いますよね。 データの集計・分析は、機械学習をするのに大前提として必要な作業です。 そんなときに便利なライブラリがPandasです。Pandasは、Pythonを使ったデータ解析に便利な機能を提供しているライブラリです。数値や時系列のデータの操作や、データ構造をいじったりすることができます。 というわけで、今回はそんなPandasを使えるようになりたい初心者の人に向けて、ちょっとしたチュートリアルを書いてみます。 ■Pandasって何ぞ Pandasとは超ざっくり簡単に言うと、Pythonを使って、ExcelやSQL、R言語みたいな感じでデータを取り扱えるようにしてくれる便利なライブラリです。 例えば、データの整列、グループ化、データ同士の結合、スライス、欠損データがあった場合の除外、時系
![機械学習にも便利なPythonライブラリ「Pandas」の初心者向けチュートリアル - paiza開発日誌](https://cdn-ak-scissors.b.st-hatena.com/image/square/c25ba729dfadbcaa6b17c6121df03fdaa65de9f8/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fp%2Fpaiza%2F20180124%2F20180124123430.jpg)