タグ

ブックマーク / note.nkmk.me (3)

  • PythonでExcelファイル(xlsx)を読み書きするopenpyxlの使い方 | note.nkmk.me

    Pythonのライブラリopenpyxlを使うとExcelファイル(.xlsx)を読み書き(入出力)できる。使い方を説明する。 BitBucketのレポジトリと公式ドキュメントは以下のリンクから。 openpyxl / openpyxl — Bitbucket openpyxl - A Python library to read/write Excel 2010 xlsx/xlsm files — openpyxl 2.5.3 documentation PythonExcelファイルを扱うライブラリの違いや使い分けなどは以下の記事を参照。 関連記事: PythonExcelファイルを扱うライブラリの比較 openpyxlは既存のExcelファイルの書式を保ったまま編集・追記(セルの値の変更、新たなセルの追加など)したい場合に便利。書式などは気にせず数値や文字列のデータを読み込んで分

    PythonでExcelファイル(xlsx)を読み書きするopenpyxlの使い方 | note.nkmk.me
  • pandasのピボットテーブルでカテゴリ毎の統計量などを算出 | note.nkmk.me

    pandas.pivot_table()関数を使うと、Excelなどの表計算ソフトのピボットテーブル機能と同様の処理が実現できる。 カテゴリデータ(カテゴリカルデータ、質的データ)のカテゴリごとにグルーピング(グループ分け)して量的データの統計量(平均、合計、最大、最小、標準偏差など)を確認・分析できる。便利。 pandas.pivot_table — pandas 0.22.0 documentation カテゴリごとの出現回数・頻度を集計する場合はpandas.crosstab()という関数が別途用意されている(pivot_table()でも可能)。 関連記事: pandasのcrosstabでクロス集計(カテゴリ毎の出現回数・頻度を算出) ここでは、 pandas.pivot_table()関数の基的な使い方 カテゴリごとの小計・総計を算出: 引数margins 結果の値の算出方法

    pandasのピボットテーブルでカテゴリ毎の統計量などを算出 | note.nkmk.me
  • pandasのcrosstabでクロス集計(カテゴリ毎の出現回数・頻度を算出) | note.nkmk.me

    pandas.crosstab()関数を使うとクロス集計分析ができる。 カテゴリデータ(カテゴリカルデータ、質的データ)のカテゴリごとのサンプル数(出現回数・頻度)の算出などが可能。 pandas.crosstab — pandas 0.22.0 documentation 出現回数ではなく、カテゴリごとの平均値などを算出したい場合はピボットテーブルpandas.pivot_table()を使う。以下の記事を参照。 関連記事: pandasのピボットテーブルでカテゴリ毎の統計量などを算出 ここでは、 pandas.crosstab()関数の基的な使い方 カテゴリごとの小計・総計を算出: 引数margins 全体・行ごと・列ごとに規格化(正規化): 引数normalize について説明する。 例としてタイタニックの生存情報のデータを使用する。Kaggleの問題からダウンロードできる。 im

    pandasのcrosstabでクロス集計(カテゴリ毎の出現回数・頻度を算出) | note.nkmk.me
  • 1