タグ

ブックマーク / uribo.hatenablog.com (10)

  • 日本語プロットの文字化けストレスを低減する - RStudio v1.4とraggパッケージを使う - cucumber flesh

    RStudio v1.4とraggパッケージの登場でRStudio上で日語の作図が面倒な指定不要で行えるようになりました。記事中で紹介する方法をとれば、RStudioのPlotsパネルに出力する図が文字化けしなくなります。RStudioユーザで日語での作図を行う方にはぜひ知っていてもらいたいtipsです。 すごい!確かにグラフィックデバイスにAGGを指定すれば、ggplot2で日語表示する際に面倒な ggplot2::theme_*(base_family = ) をしなくても、問題なく日語が表示される。ハッピー( ^ω^ ) https://t.co/DL1ec5wj9U— Uryu Shinya (@u_ribo) 2021年2月17日 なお、この記事の元ネタは https://www.tidyverse.org/blog/2021/02/modern-text-feature

    日本語プロットの文字化けストレスを低減する - RStudio v1.4とraggパッケージを使う - cucumber flesh
    Rion778
    Rion778 2021/03/29
  • DockerイメージでGitHub上のRパッケージのインストールを行う際の注意: GitHub Personal Access Tokenの設定 - cucumber flesh

    前回の記事では、CRANやそれ以外のGitリポジトリからRパッケージのインストールを行うremotesパッケージの特徴と、GitHubで管理されたパッケージのインストールを行う際のAPIに関する注意を書きました。 uribo.hatenablog.com 今回はさらにニッチな内容だと思いますが、DockerでRStudio Serverを利用する際に、GitHub上のパッケージをインストールする必要がある時のtipsとなります。昨年末、仕事納め間際にハマってしまった障害とその解決策の備忘録でもあります。 要約 DockerコンテナでGitHubからインストールするRパッケージがある場合もGitHub Personal Access Token (PAT) の設定が必要 Dockerコンテナ上のRStudio Serverを立ち上げる際は/usr/local/lib/R/etc/Renvir

    DockerイメージでGitHub上のRパッケージのインストールを行う際の注意: GitHub Personal Access Tokenの設定 - cucumber flesh
    Rion778
    Rion778 2019/07/19
  • 名前空間の衝突をconflictedパッケージで防ぐ - cucumber flesh

    要約 パッケージを複数利用すると関数名等の衝突が発生し、意図しない振る舞いを取ることがある conflictedパッケージは、こうした衝突を防ぐための機能を提供する 多少の手間を惜しんでも、衝突の恐れのある関数については名前空間を指定することを勧める 衝突にまつわるトラブル Rは標準の機能として十分な統計処理やデータ可視化の関数を備えていますが、パッケージと呼ばれる拡張機能を導入することでより多くの処理が実行可能になります。一方で多数のパッケージを使うと名前空間の衝突が発生することがあります。これは共通の名前を持つ関数やデータセット、定数といったRオブジェクトが複数のパッケージに存在する時に起きる問題です。衝突が発生すると、オブジェクトが意図しない働きをもつことがあり、トラブルの元になります。 普通、後から読み込まれたパッケージにより、先に読み込まれているオブジェクトはマスクされます。ここ

    名前空間の衝突をconflictedパッケージで防ぐ - cucumber flesh
    Rion778
    Rion778 2018/10/14
  • RMarkdownファイルの中でSQLを実行する際のtips ~knitr language engine - cucumber flesh

    公式ページに書いている内容なのだけど、覚え書き。 RMarkdownファイルでSQLを実行させるという状況があったとき、{DBI}や{odbc} といった各種のデータベース接続用パッケージや{dplyr}の接続関数を利用してデータを呼び出しても良いけど、実はチャンクコード内でSQL直書きできるという話。 過去に uribo.hatenablog.com を書いたが、こっちの方がより簡単。 まずはデータベースへの接続を行う。 ```{r} library(DBI) con <- dbConnect(odbc::odbc(), "MySQL") ``` データベースへ接続された状態がconオブジェクトに保存された。このコネクションを利用して、RMarkdown内で生SQLを実行させていく。肝心なのはチャンク内でエンジンをデフォルトのrではなくてsqlにしておくこと。そしてチャンクオプションのc

    RMarkdownファイルの中でSQLを実行する際のtips ~knitr language engine - cucumber flesh
    Rion778
    Rion778 2018/10/08
  • ggplot2ベースの図から凡例 (legend) のみ得る方法あれこれ - cucumber flesh

    タイトルに書いたように「凡例だけが描画したい」ことが時々あるかと思います(止むを得ずに凡例の位置が図から分断されてしまうときとか)。そんな時には、ここで紹介する方法を使うと良いです。やり方はいくつかあります。ここではgtableパッケージを使う場合の2例とlemonパッケージを使う方法の3通りを紹介します。 ⚠️ ggplot2の図の描画に使われているgridシステムやこの記事で扱うgtableとの関係について知りたい人は、毎度おなじみ id:yutannihilation さんの下記の記事を読みましょう。 notchained.hatenablog.com まずは凡例を含む図を作りましょう🎨 library(ggplot2) p <- ggplot(mtcars, aes(wt, mpg)) + geom_point(aes(color = factor(cyl), shape = f

    ggplot2ベースの図から凡例 (legend) のみ得る方法あれこれ - cucumber flesh
    Rion778
    Rion778 2018/09/14
    “lemonパッケージのg_legend()でggplot2ベースの図から凡例部分を取り出すことができます。”
  • 📈統計的問題を回避するためのデータ解析のプロトコル (Zuur et al. 2010): 4 データの中にゼロがたくさんあるか? - cucumber flesh

    この記事では統計的問題を回避するためのデータ解析のプロトコル (Zuur et al. 2010)で扱われているゼロ過剰問題を取り扱っている。 uribo.hatenablog.com 離散値の整数かならるカウントデータの多くはポアソン分布に従うことが一般的である。しかし、ある生息地における生物の観察数やスポーツにおける試合の得点など、0を多く含むデータが存在する。 そうしたデータについて統計モデルを適用する場合、ポアソン分布や負の二項分布を仮定した一般化線形モデル GLMなどを行うと、ポアソン分布で期待されるよりも過剰(あるいは過少)にデータが観測されることがあり推定がうまくいかないことがある。そのデータのように0の割合が多いデータに対して有効なモデルがゼロ過剰なポアソン分布モデル Zero-inflated Poisson Distribution: ZIPモデルである。 📉 カウン

    📈統計的問題を回避するためのデータ解析のプロトコル (Zuur et al. 2010): 4 データの中にゼロがたくさんあるか? - cucumber flesh
    Rion778
    Rion778 2018/08/31
  • Rから離れたくない人向けのDocker環境の操作: RStudio Serverを分析・開発の基盤にするために - cucumber flesh

    この記事はRStudioアドベントカレンダーの21日目の記事です。もうすぐこのアドベントカレンダーも終わりですね。ハヤイ! 今年のはじめにこんな記事を書きました。 uribo.hatenablog.com 皆さんはDockerを利用していますでしょうか。今年のデータ分析系のアドベントカレンダーでもぞうさんがdockerが取り上げられています。 qiita.com Rユーザの自分にとっては、Dirk EddelbuettelやCarl Boettigerなどが携わるrockerプロジェクトが整備されているのが嬉しいです。 notchained.hatenablog.com rockerプロジェクトdockerイメージの多くはRStudio Serverをイメージのベースとしており、お手軽にローカル環境とは別のRStudio環境が構築できます。また必要に応じて、rockerのdockerim

    Rから離れたくない人向けのDocker環境の操作: RStudio Serverを分析・開発の基盤にするために - cucumber flesh
  • データフレームの特徴をもっと早く掴みたい ~ ハドリーへの挑戦 - cucumber flesh

    探索的なデータ分析 (Explore Data Analysis: EDA)を行う際は、データの要約や欠損の有無の確認、可視化が欠かせない作業となります。 特に可視化は、データのもつ性質や関係を表現するのに大変役立ちます。一方で、可視化に用いた図はコードとは別に保存する必要があったり、作図のためのコードを書いたりと、面倒な側面もあります。 … きちんとした作図は面倒だけどデータの性質や欠損について把握したい。そんな時にはコンソール上での可視化を試しましょう。そのためのパッケージをHadley Wickhamが開発しています。 https://github.com/hadley/precis Rにはそもそも、オブジェクトの情報を要約してくれるsummary()関数があるのですが、この precisパッケージは、それを置き換えるような設計を目指しているそうです。早速使ってみましょう。 # gi

    データフレームの特徴をもっと早く掴みたい ~ ハドリーへの挑戦 - cucumber flesh
    Rion778
    Rion778 2017/08/09
  • Rおじさん、Pythonistaになる - cucumber flesh

    こちらをご覧ください。踏み絵ではありません。R上で地理空間データを扱うPythonモジュール、geopandasによる作図を行なっている画面です。 え、RでPythonを!?と驚かれる方もいるかもしれませんが、reticulateというRパッケージを使うことで、ほぼストレスフリーでPythonのモジュールや関数がR上で利用可能になります。先の図は次のコードによって実行されました。 library(reticulate) # モジュールの呼び出し gpd <- import("geopandas") plt <- import("matplotlib.pyplot") # サンプルデータの読み込み world <- gpd$read_file(gpd$datasets$get_path("naturalearth_lowres")) # データセットの確認 head(world) # ではな

    Rおじさん、Pythonistaになる - cucumber flesh
  • leafletでベースタイルを表示させずにポリゴンだけを表示する方法と投影法を変更する方法 - cucumber flesh

    先日行われたGlobal Tokyo.Rにてleafletについて発表してきました。発表後、ドイツからの参加者 @henningsway から質問をもらいました。それがタイトルの内容です。ちょっと焦っていたので、いや多分無理、みたいな回答になってしまいましたが、落ち着いてやればできました。@henningsway にはツイッターで返答しておいたのですが、せっかくなのでブログ記事にまとめます。 まずは利用するパッケージを読み込んで、描画するデータを用意します。描画する地図データは国土交通省国土政策局「国土数値情報(行政区域データ 平成27年4月1日時点のデータ) http://nlftp.mlit.go.jp/ksj/gml/datalist/KsjTmplt-N03.html 」を使わせてもらいます。このデータは{jpndistrict}パッケージを使って呼び出します。 今回は「東京都」を

    leafletでベースタイルを表示させずにポリゴンだけを表示する方法と投影法を変更する方法 - cucumber flesh
    Rion778
    Rion778 2017/04/12
  • 1