タグ

dplyrに関するzmsgnkのブックマーク (6)

  • http://pandas.pydata.org/pandas-docs/stable/comparison_with_r.html

  • GitHub - dodger487/dplython: dplyr for python

    import pandas from dplython import (DplyFrame, X, diamonds, select, sift, sample_n, sample_frac, head, arrange, mutate, group_by, summarize, DelayFunction) # The example `diamonds` DataFrame is included in this package, but you can # cast a DataFrame to a DplyFrame in this simple way: # diamonds = DplyFrame(pandas.read_csv('./diamonds.csv')) # Select specific columns of the DataFrame using select,

    GitHub - dodger487/dplython: dplyr for python
  • ⭐️手を動かしながら学ぶモダンなデータ操作とtidyなデータ(2015年版) - cucumber flesh

    R Advent Calendar 2015の第一日目です。 今日はタイトルの通り、{dplyr}と{tidyr}パッケージを使ったデータの整形と集計処理について、実際のデータを交えながら紹介したいと思います(タイトルは流行りのからとってきました。オマージュです)。 {dplyr}と{tidyr}パッケージ、関数の使い方を紹介した記事はあっても、実際のデータを扱った記事を検索しても、日語の記事がほとんど見つからなかったので、tidyなデータ形式について普及させるために記事を書こうというところです。 一応、自分が集められたtidyデータについての記事へのリンクを貼っておきます。 R dplyr, tidyr でのグルーピング/集約/変換処理まとめ - StatsFragments メモ:dplyr::mutate()の中でstr_split()したいと思ったとき、使うのはtidyr::s

    ⭐️手を動かしながら学ぶモダンなデータ操作とtidyなデータ(2015年版) - cucumber flesh
  • 大規模データの高速処理 ーdata.table、dplyrー

    Rは便利な統計解析ツールですが、処理の遅さや大規模データの扱いにくさが弱点と言われています。 このような状況に対処すべく、現在ではパフォーマンスの向上に役立つパッケージが数多く開発されています。 そこで今回は「Rとウェブの融合」をお休みして、data.tableとdplyrによる大規模データの高速処理について紹介します。 この記事では2014年7月現在の最新バージョン(data.table 1.9.2及びdplyr 0.2)を利用しています。 必要に応じてインストールして下さい。また紙面の都合で実行結果の掲載は省略しているので、手元の環境で試して実行結果を確認してみることをお勧めします。 > # パッケージのインストールと読み込み > install.packages(c("data.table", "dplyr")) > library(data.table) > library(dpl

    zmsgnk
    zmsgnk 2015/06/17
  • dplyrを使いこなす!基礎編 - Qiita

    はじめに 4月ということで、新卒が入ってきたりRを使ったことないメンバーがJOINしたりしたので、 超便利なdplyrの使い方を何回かに分けてまとめて行きます。 Rは知らないけど、SQLとか他のプログラミング言語はある程度やったことあるみたいな人向けです。 dplyrを使いこなす!シリーズ 基礎編以外も書きましたので、↓からどうぞ。 dplyrを使いこなす!Window関数編 dplyrを使いこなす!JOIN編 dplyrとは データフレームの操作に特化したパッケージです。 Rは基的に処理速度はあまり早くないですが、dplyrはC++で書かれているのでかなり高速に動作します。 ソースの可読性もよくなるので、宗教上の理由で禁止されている人以外は使うメリットは大きいです。 処理可能なデータサイズの目安 あくまでも個人の環境に強く依存した感覚値ですが、1000万行、100MBぐらいのデータサイ

    dplyrを使いこなす!基礎編 - Qiita
    zmsgnk
    zmsgnk 2015/04/10
  • Posit

    zmsgnk
    zmsgnk 2014/10/14
  • 1