秋山です。 機械学習やディープラーニングが流行っていますが、基本的には何をするにも大量のデータを取り扱いますよね。 データの集計・分析は、機械学習をするのに大前提として必要な作業です。 そんなときに便利なライブラリがPandasです。Pandasは、Pythonを使ったデータ解析に便利な機能を提供しているライブラリです。数値や時系列のデータの操作や、データ構造をいじったりすることができます。 というわけで、今回はそんなPandasを使えるようになりたい初心者の人に向けて、ちょっとしたチュートリアルを書いてみます。 ■Pandasって何ぞ Pandasとは超ざっくり簡単に言うと、Pythonを使って、ExcelやSQL、R言語みたいな感じでデータを取り扱えるようにしてくれる便利なライブラリです。 例えば、データの整列、グループ化、データ同士の結合、スライス、欠損データがあった場合の除外、時系