タグ

pivotとTODOに関するhiroomiのブックマーク (1)

  • pandasのcrosstabでクロス集計(カテゴリ毎の出現回数・頻度を算出) | note.nkmk.me

    pandas.crosstab()関数を使うとクロス集計分析ができる。 カテゴリデータ(カテゴリカルデータ、質的データ)のカテゴリごとのサンプル数(出現回数・頻度)の算出などが可能。 pandas.crosstab — pandas 0.22.0 documentation 出現回数ではなく、カテゴリごとの平均値などを算出したい場合はピボットテーブルpandas.pivot_table()を使う。以下の記事を参照。 関連記事: pandasのピボットテーブルでカテゴリ毎の統計量などを算出 ここでは、 pandas.crosstab()関数の基的な使い方 カテゴリごとの小計・総計を算出: 引数margins 全体・行ごと・列ごとに規格化(正規化): 引数normalize について説明する。 例としてタイタニックの生存情報のデータを使用する。Kaggleの問題からダウンロードできる。 im

    pandasのcrosstabでクロス集計(カテゴリ毎の出現回数・頻度を算出) | note.nkmk.me
  • 1