タグ

dfplyに関するishideoのブックマーク (7)

  • R ユーザーのための Pandas 実践ガイド II: siuba と datar - ill-identified diary

    概要 以前にも書いたように Python の pandas は参照透過性に欠けるため, 何度も書き換えて使用するような使い方に向いていない. これは pandas の用途と合わない. pandas をもっと快適にデータハンドリングする方法がないか探したところ, siuba, datar というパッケージを見つけたので紹介する. これらのパッケージの特徴を挙げ, 実験によるパフォーマンス比較してみた. 個人的には siuba のほうが信頼できると思うが, 現時点ではどちらも発展途上のパッケージである. 以前の続きということでタイトルを踏襲したが, 実は私がこれらのパッケージを知ったのは昨日なので「実践」的かどうかは少し疑わしい タイトルの通り R を知っている pandas ユーザーを想定読者としているが, R ユーザでなくても再利用のしやすい書き方は知っていて損はないと思う. その場合は実

    R ユーザーのための Pandas 実践ガイド II: siuba と datar - ill-identified diary
  • dplyr使いのためのpandas dfply データ加工編(tidyr) - Qiita

    はじめに dplyr同様の操作を可能にするdfplyライブラリのまとめ、今回はデータの加工編です。 なんと、tidyrの関数も使えます! 基操作は下記記事をご参照ください。 dplyr使いのためのpandas dfplyすごい編 事前準備、例データ 例データはseabornライブラリに付属しているみんな大好きtitanicと簡単に作成したデータを使います。 import pandas as pd import numpy as np from dfply import * #dfply読み込み import seaborn as sns titanic = sns.load_dataset('titanic') #titanic読み込み

    dplyr使いのためのpandas dfply データ加工編(tidyr) - Qiita
  • pandasデータフレームの日付型⇄文字型変換とdfply使用時のメモ - Qiita

    はじめに 記事は、pandasデータフレームの日付型 ⇄ 文字型の変換について - 従来の変換方法と注意点 - dfplyライブラリ使用時の変換の注意点 をまとめています。 dfplyについてのまとめの補足記事です。 事前準備、例データ import pandas as pd import datetime from dfply import * #例データ sales = pd.DataFrame(dict(date=['7/10/17','7/11/17','7/12/17','7/13/17','7/14/17'], date2=['7/10/2017','7/11/2017','7/12/2017','7/13/2017','7/14/2017'], sales=[1220, 1592, 908, 1102, 1395]))

    pandasデータフレームの日付型⇄文字型変換とdfply使用時のメモ - Qiita
  • dplyr使いのためのpandas dfplyでもJOIN編 - Qiita

    はじめに pandasデータフレームをRのdplyr同様に操作可能にするdfplyライブラリについてまとめるシリーズです。今回は100%中の100%大事なjoin関数です。複数のデータフレームを結合する関数ですね。 関連記事はこちら dplyr使いのためのpandas dfplyすごい編 dplyrのjoin関数についてはmatsuou1氏が解説している記事が分かりやすいです。 dplyrを使いこなす!JOIN編 事前準備、例データ import pandas as pd import numpy as np from dfply import * #dfply読み込み #例データ a = pd.DataFrame({ 'x1': ['A', 'B', 'C'], 'x2': [1, 2, 3] }) b = pd.DataFrame({ 'x1': ['A', 'B', 'D'], 'x

    dplyr使いのためのpandas dfplyでもJOIN編 - Qiita
  • dplyr使いのためのpandas dfply window関数編 - Qiita

    はじめに pandasデータフレームをRのdplyr同様に操作可能にするdfplyライブラリについてまとめるシリーズです。 dfplyについてはこちらをご参照ください。 dplyr使いのためのpandas dfplyすごい編 Window関数? SQLではおなじみですが、主に集計や分析に使われる関数ですね。 実行結果がgroup_byしたときのように集約されるわけではなく、入力データに対しての実行結果が戻されます。そのためmutateと一緒に使うことが多いと思います。 dplyrでのwindow関数は、matsuou1氏がまとめているこちらも参考にして頂けるとわかりやすいです。 事前準備、例データ 今回も、みんな大好きtitanicを使用します。 import pandas as pd import numpy as np from dfply import * #dfply読み込み im

    dplyr使いのためのpandas dfply window関数編 - Qiita
  • R ユーザーへの pandas 実践ガイド - Qiita

    概要 R で tidyverse (dplyr+tidyr) に使い慣れているが, Python に乗り換えると pandas がどうも使いにくい, と感じている人の視点で, Rの dplyr などとの比較を通して, pandas の効率的な使い方について書いています. そのため, 「R ユーザーへの」と書きましたが, R経験のない pandas ユーザーであってもなんらかの役に立つと思います. また, 自社インターン学生に対する教材も兼ねています. どちらかというと, 初歩を覚えたての初心者向けの記事となっています. データ分析は一発で終わることはまずなく, 集計・前処理を探索的に行う必要があります. よって, プログラムを頻繁に書き直す必要があり, 普段以上に保守性のある書き方, 例えば参照透過性を考慮した書き方をしたほうが便利です. R の tidyverse の強みとして, 再帰代

    R ユーザーへの pandas 実践ガイド - Qiita
  • dplyr使いのためのpandas dfplyすごい編 - Qiita

    以前からR, とりわけdplyrユーザーのpandas操作のために記事をまとめてきましたが、dplyr同様の操作は実現できていませんでした。が、ついにdfplyという素晴らしいライブラリを見つけましたので記事にまとめます。 関連シリーズ dplyr使いのためのpandas dfply データ加工編(tidyr) dplyr使いのためのpandas dfplyでもJOIN編 dplyr使いのためのpandas dfply window関数編 以前の記事はコチラ dplyr使いのためのpandas 基礎編 dplyr使いのためのpandas スライスsliceとインデックスindex編 dplyr使いのためのpandas マルチカラム操作編 dplyr? ってかたはコチラ(敬愛するmatsuou1氏の記事) dplyrを使いこなす!基礎編 dfplyのなにがすごい? dplyrの機能がほぼその

    dplyr使いのためのpandas dfplyすごい編 - Qiita
  • 1