タグ

Rに関するhoxo_mのブックマーク (919)

  • Speed comparison of rbind, bind_rows, and rbindlist

    hoxo_m
    hoxo_m 2020/05/08
  • Posit

    Grow your data science skills at posit::conf(2024) August 12th-14th in Seattle

    Posit
  • Amazon.co.jp: 実践 Rによるテキストマイニング:センチメント分析・単語分散表現・機械学習・Pythonラッパー: 石田基広: 本

    Amazon.co.jp: 実践 Rによるテキストマイニング:センチメント分析・単語分散表現・機械学習・Pythonラッパー: 石田基広: 本
  • ggplot2 v3.3.0を使ってみた - Technically, technophobic.

    ggplot2 v3.3.0のリリースが近々予定されています。新機能がいろいろあるのでかいつまんで紹介します。 詳しくはNEWS.mdをご参照ください。 after_stat(), after_scale(), stage() The evaluation time of aesthetics can now be controlled to a finer degree. after_stat() supersedes the use of stat() and ..var..-notation, ad is joined by after_scale() to allow for mapping to scaled aesthetic values. Remapping of the same aesthetic is now supported with stage(), so yo

    ggplot2 v3.3.0を使ってみた - Technically, technophobic.
  • 第81回R勉強会@東京まとめ

    OKIYUKI @okiyuki99 Shiny開発中によく使うショートカットで、Runボタンクリックだけは覚えておくのオススメ Mac : Command+Shift+Enter Windows : Control+Shift+Enter #TokyoR

    第81回R勉強会@東京まとめ
    hoxo_m
    hoxo_m 2019/10/01
  • Tokyo.Rでtidyr::pivot_longer()、tidyr::pivot_wider()について発表してきました - Technically, technophobic.

    第79回Tokyo.Rでtidyrの次期リリースの目玉機能、pivot_wider()/pivot_longer()について発表してきました。 次期リリースはUseR! 2019までを目指していたようですが、たぶんもう少し先になるような気はします。 スライドの最初にも書きましたが、gather()/spread()は残るので、急いで移行する必要はありません。 ただ、gather()/spread()ではできなかったこともできたりするので、データを縦に横に変換するのに苦労している方は、覚えておくと便利かもしれません。 このスライドにはあまり具体的なコードは載せられなかったので、その辺はtidyrのvignetteをご参照ください。 英語が苦手な方は、atusyさんが和訳してくれたやつを読みましょう。 個人的にはもうちょっと違う形になるのを思い描いてたんですが、まあこうなったかーという感じです

    Tokyo.Rでtidyr::pivot_longer()、tidyr::pivot_wider()について発表してきました - Technically, technophobic.
  • R-hub package builder

    hoxo_m
    hoxo_m 2019/06/28
    こんな便利なものがあったとは・・
  • 初めてのRメタプログラミング

    x # エラー: オブジェクト 'x' がありません log(x) # エラー: オブジェクト 'x' がありません curve(log(x)) # これはok いくつかのプログラミング言語を使ってきたけど Rはすごく強力な言語 Tokyo.R#76 BeginneRSession-data pipeline by @kilometer00 Tokyo.R#76 BeginneRSession-data pipeline by @kilometer00 すごい。 何がすごいか 渡したコードの意味が変わっている 引数が先頭に追加される プレースホルダー (.) 例えばJava​Script https://developer.mozilla.org/ja/docs/Web/JavaScript/Reference/Operators/Pipeline_operator Java​Script

    初めてのRメタプログラミング
    hoxo_m
    hoxo_m 2019/05/19
  • Kazutan.R

    このサイトは、私がこれまで書いてきたR関連の資料をまとめています。随時更新していく予定です。 目的やSessionInfoについてはメニューバーのaboutを参照してください。

    hoxo_m
    hoxo_m 2018/11/12
    Rに関する知識が詰まっている素晴らしいサイト
  • RStudio と vdiffr でプロットもテストしよう - Qiita

    vdiff とは vdiffr とは プロットのテストをサポートしてくれる R 言語の package です。 プロットのテストを行うことは,まだあまり一般的ではないと思うのですが, ggplot や ggridges (旧名ggjoy) ではこの vdiffr を用いてプロットのテストを行っています。 vdiffr 利用方法実例 次に実例でもって vdiffr の利用の仕方を示します。 (RStudio を用いて vdiffr でテストをするだけの package を作ります。) RStudio の package の雛形を作る機能で下記のように入力し Create Project button 押下 (R/hello.R などのパッケージ雛形ができるはずです) install.packages(c("devtools", "testthat", "vdiffr")) 下記の内容で te

    RStudio と vdiffr でプロットもテストしよう - Qiita
    hoxo_m
    hoxo_m 2018/11/07
    R で plot の test
  • vctrs::vec_method_register()が必要な理由 - Technically, technophobic.

    これがなぜ必要か、という話をします。 独自のパッケージに独自のクラスをつくったとき、必須ではないけど合わせて使うと便利、みたいなパッケージにS3メソッドを提供することが人間だれしもありますよね。ちなみに私は、まだないです。 具体的には、 ggplot2パッケージでいい感じにプロットできるようにfortify()とかautoplot()とかautolayer()を実装する tibbleのカラムとしての表示がいい感じになるようにpillarパッケージのpillar_shaft()を実装する 結果をtidyに変換できるようにbroomパッケージのtidy()を実装する みたいな感じのときです。通例、これらはパッケージに必ずしも必要ではないので、ImportsではなくSuggestsに書くことになります(後述)。 何が問題か(R 3.5.0より前) R 3.5.0時点では、S3メソッドの登録はパッ

    vctrs::vec_method_register()が必要な理由 - Technically, technophobic.
    hoxo_m
    hoxo_m 2018/09/16
  • R 2.14.0 の仕様変更とパッケージ更新の注意点 | R | Kengo Nagashima - Keio University

    R Developer Page には、リリース前のバージョンを含む R の最新情報が掲載されています。 次期リリース (2011/10/31) 予定のバージョンでの仕様変更に伴って、パッケージ開発者がアップデートする必要がある情報が Updating packages for 2.14.0 に記載されていますので、これをまとめてみます (ミスがあるかもしれませんので原文も合わせてご確認ください)。 はじめに R 2.14.0 は 2011/10/31 にリリース予定です。 パッケージ管理者は以下の変更点に留意してください。 遅延ロードについて 全てのパッケージは遅延ロードされるようになります。 DESCRIPTION ファイルに LazyLoad フィールドを設定している場合は削除してください。 LazyLoad: false を指定した場合、インストール時に警告が出ます。 これによって

    hoxo_m
    hoxo_m 2018/09/11
    「全てのパッケージは遅延ロードされるようになります。 DESCRIPTION ファイルに LazyLoad フィールドを設定している場合は削除してください。 LazyLoad: false を指定した場合、インストール時に警告が出ます」
  • データ分析のワークフローをdrakeで管理して効率的に作業を進めよう - 株式会社ホクソエムのブログ

    要約 drakeパッケージは、GNU makeのようにあらかじめ定義されたワークフローを自動的に実施する仕組みを、Rユーザに馴染みやすいデータフレーム形式で提供する ワークフローの構築と管理、実行はRの関数として提供され、依存関係を可視化する関数も用意される drakeパッケージを使うことで、データ分析でありがちな「再実行」の負担(再計算、コードの保守)を軽減することが可能となる 各オブジェクトは自動的にキャッシュされ、コードや依存関係に変更のない場合はキャッシュが利用される ワークフローの各処理の状況、依存関係を可視化する関数も用意され、ワークフロー管理が容易になる 要約 はじめに シーシュポスの岩 既存の解決策 drake: Rユーザのためのワークフロー処理パッケージ ワークフロー管理の基礎 ワークフローと依存関係の可視化 ワークフローの変更 参考URL はじめに データ分析の作業は、

    データ分析のワークフローをdrakeで管理して効率的に作業を進めよう - 株式会社ホクソエムのブログ
    hoxo_m
    hoxo_m 2018/09/10
    これはすごい
  • processx 3.2.0

    hoxo_m
    hoxo_m 2018/09/07
  • nishiyuka.net – Yuka Nishimura Personal Website

    nishiyuka.net(にしゆかネット)は西村友佳が運営する個人ホームページです。研究や仕事に関連する話、読んだや論文、日常のことなどについて記録しています。 ※サイトにはプロモーションが含まれるページがあります。詳しくはこちらをご覧ください。

    nishiyuka.net – Yuka Nishimura Personal Website
    hoxo_m
    hoxo_m 2018/09/03
  • roxygen2タグまとめ

    Roxygen2のタグについての情報が複数箇所に分散していて調べるのが大変なのでまとめた。 超訳 + 超要約 しているので、おかしなところがあれば Issues や Twitter で指摘して頂くか、 PR して欲しい。 Roxygen2を用いると、パッケージ内で定義した関数やデータセット、クラスなどについてのドキュメントや、他パッケージとの依存関係をソースコード内に連続して記述できる。 古くは開発者が適宜作成していたRdファイルがソースコード内のRoxygen2コメントに基いて動的に生成されるため、ユーザーが扱うファイルを限定でき、更に実装とドキュメント化を並行できると良いことづくめだ。 気付きがあれば随時更新していきたい。 Roxygen2タグ はRStudioの入力補完機能で出現したもの (Roxygen2 v7.1.1) Rdコマンド は Roxygen2タグ に対応するものがあれ

    roxygen2タグまとめ
    hoxo_m
    hoxo_m 2018/08/30
  • クロネッカー積でデータを列方向(or行方向)に高速に複製もしくは定数倍する - 株式会社ホクソエムのブログ

    r-wakalangからの転載です。以下のような質問がありました。 data.frameをカラム・ロウ方向に複製結合したdata.frameを出力させたいのですが、どうも綺麗に書けずです。。アドバイスお願いしますm( )m この意味は、例えば「行方向に2個・列方向に3個複製」の場合は以下の図です。 データフレームが数値のみの場合、これは実はクロネッカー積と呼ばれる行列の特殊な積で表現できます。 Rで書く場合 Rではデフォルトで%x%関数(or kronecker関数)が用意されているのでそれを使えば簡単に実装できます。 B <- as.matrix(data.frame(a=1:3, b=4:6)) A <- matrix(1, nrow=2, ncol=3) res <- A %x% B Pythonで書く場合 Pythonでもnumpyにkronメソッドが用意されていますので、以下のよ

    クロネッカー積でデータを列方向(or行方向)に高速に複製もしくは定数倍する - 株式会社ホクソエムのブログ
  • モデルで扱うデータの前処理をrecipesで行う - 株式会社ホクソエムのブログ

    ドーモ。ホクソエムの @u_ribo です。業ではモデリングとは離れたギョームをしています。寂しくなったので、Rのrecipesパッケージについて紹介します。 tidymodels.github.io モデルに適用するデータの前処理 Rでのモデル式 (model formula) の記述って、利用時に不便を感じることや覚えるのが難しい面が時々ありませんか?例えば、y ~ .」は右辺のドットが、目的変数以外の全ての変数を説明変数として扱うことを示しますが、説明変数に対数変換などの変数変換を行うにはy ~ log(.)という記述はできず、結局、説明変数を「+」でつなげていくことになります。また、交互作用項の指定には「x1 * x2」や「(x1 + x2)^2」、「:」を使う表記が可能ですが、この表記には最初は混乱しませんか?(単に私が不勉強なだけということもあります) 加えて、多くのモデルで

    モデルで扱うデータの前処理をrecipesで行う - 株式会社ホクソエムのブログ
    hoxo_m
    hoxo_m 2018/08/29
  • Exploring correlations in R with corrr • blogR

    @drsimonj here to share a (sort of) readable version of my presentation at the amst-R-dam meetup on 14 August, 2018: “Exploring correlations in R with corrr”. Those who attended will know that I changed the topic of the talk, originally advertised as “R from academia to commerical business”. For anyone who’s interested, I gave that talk at useR! 2018 and, thanks to the R consortium, you can watch

    Exploring correlations in R with corrr • blogR
    hoxo_m
    hoxo_m 2018/08/22
    こらー!
  • UseR!2018に参加し、社内Rパッケージ「liner」の活用事例を紹介しました - LINE ENGINEERING

    By Yutani Hiroaki | 2018.08.15 2021.01.08Software Engineer at Data Analysis team, Data Labs. ドーモ、Data LabsのYutani (湯谷)です。 私の所属しているData Labsは、LINEメッセンジャーを含めた全サービスのデータの分析・研究・応用のための専門的な開発組織です。 サービスの事業領域を超えて、各サービスのログや利用動向などのデータを横断的に処理し、より精密なデータ分析と情報フィルタリングを提供し、全サービスのデータの効率的な活用を目標に日々精進しています。 2018年7月10日〜13日に開催されたUseR!2018に参加しポスター発表を行いました。その様子の一部をブログで紹介します。 UseR!とは UseR!は、世界中からRユーザが集まるR界最大のカンファレンスです。毎年1回

    UseR!2018に参加し、社内Rパッケージ「liner」の活用事例を紹介しました - LINE ENGINEERING
    hoxo_m
    hoxo_m 2018/08/20