Kien Y. Knot😵💫 @0_u0 ナァ……お前TokyoRのLT準備する釣ったよなぁ……なんでkaggleやってんだよ……なぁ……わかってんのか……優先順位在るだろ……なあ……
統計データを分析する際に使う「R」というプログラミング言語がある。無料のオープンソース・ソフトウェアで、Rを使えば、データの加工や操作、線形回帰、ランダムフォレストのような機械学習の分析、解析したデータの可視化が可能になる。「Python(パイソン)」と並び、統計分析を手がける人々に人気の言語だ。 Rはオープンソースのため世界中のエンジニアが修正や機能追加を進めている。その中で、データフレームの操作に特化した「dplyr(ディープライヤー)」やデータ可視化の「ggplot2(ジージープロット2)」など、人気のパッケージ開発で貢献した人物がいる。ソースコードの入力からコンパイルやデバッグまでが可能なRの総合開発環境を提供するRStudioのチーフ・サイエンティスト、ハドリー・ウィッカム氏だ。 ウィッカム氏が独力で作り上げたパッケージは今では大学の研究者からジャーナリストまで、数多くの人間が使
概要 reticulateパッケージはPythonを活用するRのパッケージ reticulateパッケージの使い方とライブラリ利用例を実行結果を提示して確認 試したライブラリはSentence Piece, Pytorch, AllenNLPなどは動作している (本記事ではRを「パッケージ」とPythonを「ライブラリ」という風に書き分けています) 前書き 有用なライブラリがPythonで開発されているため使いたくなりますが、Pythonはわからない・書けないというRユーザーは未だに多くいらっしゃいます。 しかしながら、すでにあるPythonライブラリの関数にデータを適用した結果だけが欲しいのであれば、reticulateパッケージで事足りてしまうようです。 同様のパッケージには以前に紹介したPythonInRやrPythonなどがありますが、reticulateがリリースされてからは私は
When you work with R for some time, you really start to wonder why so many R packages have some kind of pun in their name. Intended or not, the poLCA package is one of them. Today i´ll give a glimpse on this package, which doesn´t have to do anything with dancing or nice dotted dresses. This article is kind of a draft and will be revised anytime. The „poLCA“-package has its name from „Polytomous L
ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには理系出身者が定石やで山岡はん。」 山岡「確かに、数学のスキルが要求されるデータサイエンティストには普通の文系出身者は厳しい。しかし、彼の学部時代の専攻は計量経済学。実務では高度なアルゴリズムやビックデータの解析基盤の構築のスキルなんか本当は必要ない、経済学の手法が求められているんだ。」 京極「なんやてっ!」 山岡「ビッグデータといっても、小売りの場合大きくて1千万件程度、普通のRDBMSで処理可能だし、非構造化データなんて必要ない。アルゴリズムもSPSSやRなんかのツールに入力して結果を解釈できれば十分なんだ。一方で、政府の統計を駆使して地域の需要を推
2023/02/06追記: slideshareが非常に使いづらくなってしまったため、speakerdeckに転載しました。 https://speakerdeck.com/masaha03/hazimeteno-r 補足記事を書きました。併せてご覧ください。http://m884.hateblo.jp/entry/2012/12/03/232431Read less
試験の点数から○○大学に合格(T)か不合格(F)かを予測したいときや,検査値から病気(T)か健康(F)かを判断したいときなどがあります。要するに,与えられた値から,真(TRUE)か偽(FALSE)かを判断したいわけです。 例として右の表のような場合を考えましょう。 与えられた値をどこで切っても,TとFは完全には分離できません。例えば11で切って,11以上を陽性(positive),11未満を陰性(negative)とした場合,10個のTのうち5個がpositiveに入りますので,true positive(真陽性)の割合は0.5です。また,5個のFのうち1個がpositiveに入りますので,false positive(偽陽性)の割合は0.2です。そこで,(0.2, 0.5) をプロットします。このように,区切る値(閾値,カットオフポイント)をいろいろ変えて,横軸にfalse positi
Notes on the use of R for psychology experiments and questionnairesJonathan Baron Department of Psychology, University of Pennsylvania Yuelin Li Department of Psychiatry & Behavioral Sciences Memorial Sloan-Kettering Cancer Center *March 6, 2011 Contents 1 Introduction 2 A few useful concepts and commands 2.1 Concepts 2.2 Commands 2.2.1 Getting help 2.2.2 Installing packages 2.2.3 Assignm
Incanter is a Clojure-based, R-like platform for statistical computing and graphics. Incanter can be used as a standalone, interactive data analysis environment or embedded within other analytics systems as a modular suite of libraries. Features Charting & visualization functions Mathematical functions Statistical functions Matrix & linear algebra functions Data manipulation functions Interactive,
ggplot2 is a plotting system for R, based on the grammar of graphics, which tries to take the good parts of base and lattice graphics and none of the bad parts. It takes care of many of the fiddly details that make plotting a hassle (like drawing legends) as well as providing a powerful model of graphics that makes it easy to produce complex multi-layered graphics. Documentation ggplot2 documentat
R AnalyticFlow ウェブサイトに移動します。 自動的に移動しない場合は リンクをクリックするか、ブラウザのアドレスバーに 直接 "r.analyticflow.com/ja/" と入力してください。
HTML アプリケーションを用いた 簡易 R ツールの作成方法 舟尾 暢男 武田薬品工業 イントロ HTAApplication どうすれば「メニュー操作でデータ解析が出来る ソフト」をお手軽に作成することが出来るの?? -R - HTA と R の組み合わせ ← 要プログラミング - R Commander に機能追加 ← 結構手間がかかる ← まだマシ??? HTAApplication Page 2 R とは? オープンソース&フリーの統計解析用ソフト 【長所】 HTAApplication 数値計算,統計解析,グラフィックス等の機能がある 機能拡張が容易に行える 使用人口が多いので,バグが少なく情報も豊富 【短所】 EXCEL などの表計算ソフトに比べて GUI (マウス操作) の機能が劣っている ⇒ R の命令を一つ一つ覚えるのが大変… ↑の短所を補う方法の
気の利いたタイトルが浮かばない : for と apply どっちが速い?の真似をして,forとapplyの速度比較をやってみた。apply族の関数は僕は主にdata frameに対して使うので,そのあたりを中心に。テストに使用したスクリプトは以下。 v1 <- 1:10 col_len <- c(1:9*1000, 1:10*10000) names(col_len) <- col_len dlist <- lapply(col_len, function(x)matrix(rep(v1, x), ncol=x)) dlist2 <- lapply(dlist, as.data.frame) fun_lapply <- function(x)system.time(lapply(x, sd))[[3]] fun_sapply <- function(x)system.time(sappl
R でプログラミング:データの一括処理とグラフ描き started on 2005-06-06 updated on 2008-03-13 この文書は,フリーの統計解析・作図システム R を使って, データの一括処理と図化のプログラムを書けるようになるためのチュートリアルです. R の経験がまったくなくても読めるように書いています. ただし統計解析手法についての解説はほとんどしていません. 他のページや書籍を見てください. 目次 0. はじめに:この文書のねらい 1. 準備一般 2. ひとつのファイルからデータを読み込む 3. ひとつのファイルのデータの処理 4. グラフを描いてファイルに保存する 5. グラフのいろいろな設定 6. グラフの重ね描き 7. 繰り返しと条件分岐:コンピュータらしい仕事 8. 繰り返しと条件分岐で柔軟なグラフ描画 9. 補足:変数の寿命と有効範囲 10. デー
実際に使われる統計モデルを包括的に紹介,かつRによる分析例を掲げた教科書。〔内容〕マネジメントと意思決定モデル/市場機会と市場の分析/競争ポジショニング戦略/基本マーケティング戦略/消費者行動モデル/製品の採用と普及/他。
最終更新: 2008年 8月 27日 (水曜日) 15時35分 このページでは,国際共同研究のオープンソースなプロジェクトで開発され,GNU GPLに従って公開,配布されている高機能な統計ソフトであるRについてのTipsを扱う。 News/更新情報 保管庫1(2004年1月まで) | 保管庫2(2004年2月から) 保管庫内の主なトピック:平方和(SS)|「Rによる統計解析の基礎」(保管庫外だがサポート掲示板|正誤表)|オッズ比 |1.6.0|1.6.1|1.6.2|1.7.0|1.7.1|1.8.0 | 1.8.1|1.9.0|1.9.1|2.0.0|2.0.1|2.1.0|2.1.1|2.2.0|2.2.1|2.3.0|2.3.1|2.4.0|2.4.1|2.5.0|2.5.1|2.6.0|2.6.1|2.6.2|2.7.0 R News Vol.8/1公開(2008年6月5日) ●5
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く