dplyr::copy_to()とかどうやってるんだろう、と思ってたら、DBIパッケージになんか色々便利関数があるらしい。この辺を眺めていて知ったやつ。 sqlCreateTable() データフレームの定義をクエリに変えてくれるやつ。中身を見ると、こんな感じで、コネクションを第一引数に取るS4の総称関数。 library(DBI) sqlCreateTable #> standardGeneric for "sqlCreateTable" defined from package "DBI" #> #> function (con, table, fields, row.names = NA, temporary = FALSE, #> ...) #> standardGeneric("sqlCreateTable") #> <environment: 0x00000000096743c
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 今シリコンバレーで、もしくは世界中のスタートアップ業界で一番ホットな会社といえばAirbnbと言っても過言でないのでしょうか。日本では民泊のプラットフォームとして知られていますが、今や3兆円近い企業価値がついている超ユニコーン企業です。私も日本に行く時はホテルでなく、いつもAirbnbで普通のアパートを一週間ほど渋谷のあたりに借りますが、使いやすく、コストパフォーマンスもよく、出張をするときには欠かせないサービスです。 Airbnbnはシリコンバレーのスタートアップの中でも特にデータの使い方がうまい会社として有名で、いろいろとデータに関
ggrepel パッケージを使うと、ggplot2 パッケージによる可視化の際に、ラベルとラベルが重なって見にくくなることを防ぐことができる。 はじめに R の ggplot2 パッケージで散布図などを作るときに、データ点に対してラベルをつけたいということがあるだろう。そういったときに便利なのが、ggrepel パッケージである [1] 。この ggrepel パッケージを使えば、ラベル同士が重なることが抑制される [2] 。なお、以下では散布図の場合を扱うが、ggrepel パッケージは他の種類の可視化にも利用することができる。例えば、Matt Strimas-Mackey 氏は Mapping the Longest Commericial Flights in R という記事の中で、地図上のラベルが重ならないようにするためにこのパッケージを用いている。 使い方 まずは、必要なパッケー
ggplot2で可視化しようとして、データ系列が多すぎてこんなもじゃもじゃになってしまう、みたいなことないでしょうか。 これを、一部だけを色付けしてこんな感じのプロットにしてくれるパッケージをつくりました。 インストール GitHub上からインストールできます。 devtools::install_github("yutannihilation/gghighlight") gghiglightがやっていること gghiglightの説明をする前に、まずは上のグラフが何をしているのか、まずはふつうのtidyverseでやってみます。 データはこんな感じのやつです。 library(dplyr, warn.conflicts = FALSE) set.seed(1) d <- tibble( idx = 1:10000, value = runif(idx, -1, 1), type = sa
(オススメ!)日本心理学会 第81回大会 公募シンポジウム「心理学におけるベイズ統計モデリングの可能性」の資料はこちら
概要 ベイズ構造時系列モデリングを行う bsts パッケージは最近リリースされたばかりである. このパッケージはまだ (日本語の) 情報が少ないため, ここで理論と応用例を包括的に説明することを試みる. bsts とは, Bayesian Structural Time Series, つまりベイズ (ベイジアン) 構造時系列モデルの略称である. 某有名IT企業の某有名データサイエンティストの方が bsts パッケージの入門記事 tjo.hatenablog.com を書いていたが, より詳細で広範な説明がほしいところであった. 奇しくも bsts の開発者もこの方と同じ企業に所属しているので, 何か特別な思い入れがあるのかとも思ったが, 本人はなかなかより詳細な記事を書く気配がないため, しびれを切らして自分が書くことにした (あてつけではない). この記事の残りの構成は次の通り. まず
RStudioに記載されている通りなんだけど手順をメモしとく。 リバースプロキシにNginxもインストールしてhttp://ホスト名/rstudio/でアクセスできるようにする。 (2014.2.28追記) ※ plotなどで日本語が文字化けしたので対応を追記 1. Rインストール 事前にEPELをリポジトリに追加しておくこと。 sudo yum --enablerepo=epel install R -y 2. RStudio-Serverインストール wget http://download2.rstudio.org/rstudio-server-0.98.501-x86_64.rpm sudo yum install --nogpgcheck rstudio-server-0.98.501-x86_64.rpm (2014.2.28追記) plotなどで日本語が文字化けするので"日本
感情分析 テキスト分析の1つに、単語の感情表現がポジティブなのかネガティグなのかを判定する方法がある。テキスト中に出現する単語の感情特性を調べることで、テキスト全体がポジティブな内容を表現しているのか、ネガティグな内容なのかを判定することが可能かもしれない(単純に考えれば)。 こうした分析を Sentiment Analysyis(感情分析)という。 本稿では R 上で日本語テキストの感情分析を行なう方法を解説する。 ここでは歴代首相の所信表明演説をデータとして分析を試行するが、何らかの結論を導くことではなく、Rで感情分析を実行する上で想定される様々な操作を紹介するのが目的である。 感情分析のためには、単語ごとに感情特性値を割り当てた表が必要となるが、いくつかの辞書が公開されている。これらの辞書では、単語ごとに感性評価をプラスないしマイナス、あるいは正負いずれかの数値を対応させていることが
この記事は、Rのggplot2パッケージの「Extending ggplot2」というVignetteを訳したものです。原文はGPL-2ライセンスで公開されているggplot2パッケージに含まれ、著作権はHadley Wickhamに帰属します。この翻訳文にもGPL-2ライセンスが適用されます。 Note that the original document is provided under the license of GPL-2 and the copyright belongs to Hadley Wickham, one of the authors of ggplot2. このvignetteには、ggplot2 2.0.0で公式に提供される拡張メカニズムについて書きます。 このvignetteは、?Statや?Geomや?themeで読むことができる低レベルな詳細をまとめたも
AI is suddenly everywhere. Do you need to go and get a shiny machine learning degree to remain competitive? John Maeda says not to worry. He’ll show you how to cook delicious dishes into your coding repertoire with his new show - Mr. Maeda’s Cozy AI Kitchen. Find out how you can use GitHub Copilot, an add-on that is powered by AI, to get helpful suggestions when writing code or documentation. This
はじめに JUMAN++という日本語の形態素解析器が昨年登場したようです。 速度はMeCabには劣るものの、解析精度(特に表記ゆれや話し言葉)に強いようです。 JUMAN++自体のインストールや使い方は公式マニュアルや以下のリンクが参考になります。 qiita.com あと、おそらくJUMAN++は現時点ではWindows非対応なので、以下の話は全部MacかLinux限定の話になります… パッケージを作りたい OSは限られるものの、やっぱりこういうのってRから操作したくなります。 C++ラッパーがあればRcppで書けるのですがそれも探したところないようなので、以下のリンクを参考にコマンドラインで実行したものをRの変数に入れるというやや強引な方法で関数を書いています。 wanko-sato.hatenablog.com また、まだ本当に作り始めたばっかりで現状1種類の関数しかないという大変お
統計解析の再現可能性を高める取り組み 1. 統計解析の再現可能性を 高める取り組み 専修大学人間科学部心理学科 国里愛彦 2017/7/8 臨床疫学研究における報告の質向上のための統計学の研究会 第30回「Rを用いたデータハンドリング入門:効率的かつ再現性の高い統計解析のための第一歩」 2. 再現性の危機 • 心理学研究 本のうち再現されたのは 本 • 引用数が多く効果があるとされた臨床医学研究 本のうち再現されたのは 本 • 名の調査から, が他の研究者の研究を再 現できず, が自分の研究の再現もできなかった 3. と • 再現可能性 :ある現象が他の研究者 が行った研究でも再現されること(新規なデータ収 集あり) • 再生可能性 :データから解析結果 が再生できること(新規なデータ収集なし。コードや データの共有などで確認する) →今回は,再生可能性について扱う Peng, R. D.
Introduction to optimal changepoint detection algorithms Rebecca Killick(r.killick@lancs.ac.uk) useR! Tutorial 2017 See the GitHub repository for links to source code and exercises: https://github.com/tdhock/change-tutorial There are tasks throughout the sections. You may not get time to complete all the tasks within the workshop but feel free to contact me after the workshop if you require suppor
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く