Excelなどでよく使われるピボットテーブル。 それをpandasのデータフレームで使う場合には DataFrame.pivot()DataFrame.pivot_table() の2種類があります。 今回はピボットテーブルの使い方と2つの関数の違いをご紹介します。 他に似たような機能としてはDataFrame.groupby()があります
概要カテゴリカル変数と連続変数の関係の分析に特に有効で、Excelでもよく使うピボットテーブルの機能ですが、Pythonのpandasでもpivot_tableというメソッドを使うことが出来ます。本記事ではこのpivot_tableの全引数の効果を検証しました。なお、pandasのバージョンは0.23.4を使っています。 引数一覧pandasのpivot_tableには以下の7引数があります。以降、それぞれについて説明していきます。 valuesindexcolumnsaggfuncfill_valuedropnamargins_nameまた、データとしてはirisを使用しました。 df = pd.read_csv("iris.csv", index_col=0) df.head() データ分析の定番データセットですね。(全150件の最初の5件を表示しています) SepalLength S
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く