タグ

ブックマーク / notchained.hatenablog.com (6)

  • 俺たちのtidyverseはこれからだ! - Technically, technophobic.

    ※この投稿はR Advent Calendar 2016の6日目の記事です。 11/27のJapan.R 2016でLTしたtidyverseについて書きます。スライドは以下です。 Tidyverseとは from yutannihilation (ちなみに、この投稿のタイトルは@siero5335さんのツイートがエモくてすてきだったので勝手に拝借しました。すみません) tidyverseとは 単に「tidyverse」と言ったときに、この言葉が指す対象はいくつかあります。 概念 パッケージ (GitHub上の)組織 あと、誰が運営しているのか分からない謎のTwitterアカウントとかもあるんですが、あれはたぶんただの脇役なので捨ておきましょう。以下、順番に説明していきます。 tidyverse(概念) tidyverseというのは、R界の神として崇められるHadley Wickhamが作

    俺たちのtidyverseはこれからだ! - Technically, technophobic.
  • dplyrのmutate_if()とかについて - Technically, technophobic.

    1か月前にキターとつぶやいたものがついにCRANにきたのでそれについて書きます。 Colwise update https://t.co/AotXyUjYmv キター!— Hiroaki Yutani (@yutannihilation) 2016年5月31日 これは何なのか 複数のカラムに対して同じ処理をするとき、これまではmutate_each()、summarise_each()という関数がありました。 たとえば、Sepalから始まるカラムすべてにmin()とmax()を適用したいときはこんな感じです。 library(dplyr) iris %>% group_by(Species) %>% summarise_each(funs(min, max), starts_with("Sepal")) #> Source: local data frame [3 x 5] #> #> S

    dplyrのmutate_if()とかについて - Technically, technophobic.
  • dplyr 0.3の新機能を使ってみる - Technically, technophobic.

    dplyr 0.3が次の金曜にCRANにくるらしいです。 Please try out dplyr 0.3 RC from https://t.co/1HYJga3pr2. So much new stuff! https://t.co/lwF3yJJJCf Will go to CRAN next Friday #rstats— Hadley Wickham (@hadleywickham) 2014, 9月 25 色々新機能があるとのことなので、ひとまず使ってみました。こういうのRPubsにあげるべきなのかなとか思いつつ、よく分からないのでひとまずブログに。 インストール (この部分は、10/4以降はたぶん不要。install.packages()で入れられるはず) library(devtools) install_github("hadley/lazyeval") install_

    dplyr 0.3の新機能を使ってみる - Technically, technophobic.
  • dplyr 0.4を使ってみる - Technically, technophobic.

    追記('15/01/04):*_join()の図を追加しました。 新年早々、dplyrの新バージョンがリリースされるらしいです。 dplyr/NEWS.md at master · hadley/dplyr · GitHub 新機能についてはHadleyさんがRPubsに書いてるので、もうブログ書かなくてもいいかなーと思いつつ、修行のため使ってみます。 RPubs - dplyr-0.4 インストール まだCRANには来てないのでinstall_github()します。 devtools::install_github("dplyr") バージョン確認。 > packageVersion("dplyr") [1] ‘0.4.0’ add_rownames() add_rownames() turns row names into an explicit variable (#639). r

    dplyr 0.4を使ってみる - Technically, technophobic.
  • broom 0.3.7を使ってみる - Technically, technophobic.

    R界隈の最新動向をストーキングすることに定評がある@u_ribo氏が、こんな情報をさらっと書いていました。情報網すごすぎる。 "fortify は将来廃止予定とのことであり、 代わりに{broom}パッケージを使うことをHadleyは推奨している" http://t.co/lkSuQMC6eW ええっ!!!— Hiroaki Yutani (@yutannihilation) 2015, 10月 9 broomってそんなことできたっけ??、と気になりすぎたのでbroomをちょっと触ってみます。 broomとは たぶんこのVignetteを読むのが分かりやすいと思います。ここに書くコードもこのVigentteをパクり参考にしました。 broom: let's tidy up a bit 要は、クラスによってデータの構造が違うのを吸収して、統一的なフォーマットのきれい(tidy)なdata.f

    broom 0.3.7を使ってみる - Technically, technophobic.
    mahler-5
    mahler-5 2015/10/17
  • Ubuntu 14.04でSparkを試してみた時のメモ - Technically, technophobic.

    Spark 1.3.0がリリースされたらしいです。 Spark Release 1.3.0 | Apache Spark でも、いかんせんSpark使ったことなくてよくわかりません。とりあえずインストールくらいはしてみるか、と思ってやったときのメモ。 ※いろいろ試して動いたのをまとめてるだけなので、必要な手順が足りてなかったり、関係ない手順が入ってるかもです。あんまり理解できてません。。 Hadoopをインストールする 参考:Apache Hadoop 2.6.0 - Hadoop MapReduce Next Generation 2.6.0 - Setting up a Single Node Cluster. 何はともあれ、まずはHadoopをインストールしてsingle-nodeで動かします。この記事を書く時点での最新バージョンは2.6.0でした。 とりあえずJavaを入れます。

    Ubuntu 14.04でSparkを試してみた時のメモ - Technically, technophobic.
  • 1