Rのステキグラフィックスライブラリ「ggplot2」のqplot関数についてまとめてみた.少し頑張りすぎた. 関連記事:ggplot2の概要 - ぬいぐるみライフ? qplot関数とは ggplot2にはqplot(Quick PLOTの略)というステキな関数が用意されている.これを使うと,デフォルトの設定のままでもRのbaseライブラリ(plot関数など)と比べてきれいな図が描ける上に,色付けや凡例の設定もある程度よしなにやってくれる. 以降,ggplot2のqplot関数について詳しく見ていくことにしよう. この記事の構成 最初に,qplot関数について以下のことをチェックする. qplot関数の基本 qplot関数のdataパラメータ 次に,以下のグラフについてbaseライブラリとggplot2のqplot関数の間でシンタックスの違いや描画されるグラフを比較していく. 散布図 折れ線
最近出たプロダクトで「RStudio」というのがあるんですが、試しに使ってみてあまりにも洗練されてて感動したのでエントリにしました。 RStudio って何? そもそもなにするものかというと、統計分析・グラフ作成プログラミング言語である R の IDE みたいなもので、PC 上でスタンドアローンで動かすこともできますし、サーバ上のリソースをブラウザ越しに扱うこともできます。スタンドアローンの方はすでに Windows や Mac などひと通りバイナリありますし、サーバの方も Ubuntu/CentOS はバイナリあって楽々使えるようです。 ちなみに最初 Amazon Linux で動かしてみようと思ってたんですが、Amazon Linux は微妙にパッケージを新しくした CentOS みたいな感じなので各所でライブラリのバージョンがずれてて依存関係で破滅的になりました。だったら make
基礎外部スクリプトの読み込みRコンソールに一行ずつコマンドを入力してもいいけど、実際に使うにはテキストファイルにコマンドを書いて(ソースコード)一気に実行させる方が楽。 source('hogehoge.R') hogehoge.Rというのがソースコードを書いたファイル(ソースファイル)の名前。 ライブラリの追加CRANという、CPANのパクリがある。膨大な数のライブラリがあるので、好きなものをインストールするには、 install.packages('hoge',dependencies=TRUE) とするのが楽。 変数宣言不要。変数に使える文字も結構多い。日本語でもOK。 > あ<-1 > あ [1] 1 代入a<-1 b=2 1->a どれでもいい。但し推奨されてるのは一番上。Rの人は「束縛」という言葉を使いたがる傾向があるけど、どっちでもいいと思う。 余談だけど、関数の引数の中で代
なんだかweb屋界隈ではHadoopだのMahoutだの象を使うだの使わないだの楽しそうな事をやっていて、私はとてもさみしく、そしてうらやましくもなったわけですが手元にそんな立派な環境なんてないわけで。しかし、そんな私にもマルチコアのパソコンが与えられているのでそれで計算の並列化をやってみた。OSはwindows XP(32bit)。 使うのは統計数理研究所のセミナーでお薦めされていたforeachパッケージ*1。これはRevlution Rの人たちが作っているので今後とも継続的な開発と進化が期待できるとのこと。まずは、doSNOWパッケージも合わせてインストール。 install.packages("foreach") install.packages("doSNOW") foreachパッケージではforループの並列化をしてくれるのですが、処理を並列化させないで書くこともできるのでまず
第11回R勉強会@東京(Tokyo.R#11)を開催しました! Rによるデータサイエンス第?部 第6章 自己組織化マップ 発表者 : @bob3bob3さん Tokyo r 11_self_organizing_mapView more presentations from Bob#3. 要は、脳内メーカー(?) 大規模データ向け 主成分分析や因子分析に比べて、何が変わってくるのかが良く分からない ggplot2:パッケージ製作者(Wickamさん)の話を聞いて 発表者 : @aad34210さん ggplot2 110129View more presentations from aad34210. こんな人向け デフォルトのplotでは物足りない 簡単にきれいなグラフ描きたい 基本的な使い方 ggplot qplot グラフの重ねがき ggplotの場合 : ~+ geo_jitter
2011/01/29 第11回R勉強会@東京(Tokyo.R #11) で講師をしてきました。 「R言語による Random Forest 徹底入門 −集団学習による分類・予測−」。 Random Forest は"機械学習"の方法論で、集団学習により精度高い判別・予測を実現します。 双方向の進行で、質疑応答・議論含め 合計60分で話しました。 「R言語による Random Forest 徹底入門 −集団学習による分類・予測−」 - #TokyoR #11View more presentations from Koichi Hamada. 隠れ Random Forest 祭り 今回のTokyo.R、実は「隠れ Random Forest 祭り」。直前の3トーク、「3. caretパッケージの紹介」(id:dichika [Twitter:@dichika])、「4. RにおけるHPC
調査を行うときは全数調査を行えば統計的な推測を行う必要はありませんが、どうしてもサンプリングして部分集団の解析で全体を推測したいという場合があります。 例えば国や県単位の統計を出したいけど全数調査は無理だとか、データは全てあるけどPCのスペック上一度に解析できないとか。 そんなときのサンプリング方法として次のようなものがあります。 ランダムサンプリング(標本の重複なし) ブートストラップサンプリング(標本の重複あり) 層別サンプリング バランスサンプリング(cube model) SASではproc surveyselectが用意されており、Rではsamplingライブラリがあります(SASのヘルプはここにあります)。 SASの場合はmethodで方法を指定できて、例えばmethod=ursでブートストラップサンプリング、またstrataを指定することで層別サンプリングをします。 Rのsa
Notes on the use of R for psychology experiments and questionnairesJonathan Baron Department of Psychology, University of Pennsylvania Yuelin Li Department of Psychiatry & Behavioral Sciences Memorial Sloan-Kettering Cancer Center *March 6, 2011 Contents 1 Introduction 2 A few useful concepts and commands 2.1 Concepts 2.2 Commands 2.2.1 Getting help 2.2.2 Installing packages 2.2.3 Assignm
lme4パッケージが更新されました。 今回は、大幅に仕様がかわったようです。 ・計算アルゴリズムを改善して、より頑健になり、計算が早くなった。 ・PQLが使えなくなった。 ・引数のmethodがなくなった。 ・glmer()という関数ができた。 ・mcmcsamp()のサンプリング方法が変わった。 今回の更新で我々エンドユーザーが特に注意しなければいけないのは、methodでしょう。 尤度を求めるmethodは、正規分布の場合"REML"と"ML"、それ以外の分布では、"Laplace"と"PQL"でした。 しかしながらPQL法は、問題があり、あまり正確な推定をしないことが指摘されています。方法がそれしか使えなかった時代ならいざしらず、現在はglmmMLやlmerのようにLhaplaceやghq(glmmMLのみ)のようにPQLより正確で尤度を求める方法が実装されているので、あえてPQLを
オープンソースの統計解析パッケージ R については,心理学でもじわじわと認知されるようになってきたと思う. Rの利用法については,すでにさまざまな書籍が出版されているし,有益なサイトもたくさんある.ただ,それらで紹介される事例はそのための事例であることが多く,実際のデータ解析の場では,あれこれ工夫をしなければならないことが多い. なので,ここでも自分なりのデータ処理の事例を記事にして,アップしてみようと思う.決して,洗練された手法ではないかもしれないが,読んだ人にも何かの参考になるかもしれないし,自分の備忘録くらいにはなるだろう.もっとよい手法をお知りの方は,コメントなりトラックバックで教えてほしい. 第1回目は,クロス表における調整化残差の計算である. 調整化残差が分かるというのは,χ2値なんかよりも有益な場合が多い(と思う).でも標準の出力では出てこないし,いくつかの書籍やサイトで調べ
Last Year I introduced you to R Commander, a nice graphical user interface (GUI) for R for those of you who are still hesitant to leave the clicky-box style research a la SPSS for the far more superior reproducible research using R. As most of you know I'm a huge fan of ggplot2. Many of you came to the short course Hadley Wickham gave here a few weeks ago on ggplot2 and plyr. I just came across De
10. twitteRパッケージ # twitteRパッケージを読み込む library(twitteR) # @a_bicky のツイートを3,200件取得(3,200件がMAX) tweets <- userTimeline("a_bicky", n = 3200) str(tweets[[1]]) # 最初のツイートの情報を出力 出力 Formal class 'status' [package "twitteR"] with 10 slots ..@ text : chr "RではもしかしてNULL文字を取り除くことできない!? #r" ..@ favorited : logi FALSE ↑ ツイートのテキスト ..@ replyToSN : chr(0) ..@ created : POSIXct[1:1], format: "2010-12-01 14:17:31" ← ツイ
togetter Rユーザー会2010 初日 Professor Hadley Wickham の発表資料 Rユーザー会2010 二日目 Professor Uwe Ligges の発表資料 Rユーザー会2010 三日目 鈴木 了太 (株式会社ef-prime) 「Rによるデータ解析ツールの新提案」 R Analytic Flow。 SAS EG みたいな R のフロントエンド・Javaで書かれている。 触った感じと見た目がかなり良い。 資料。 長島 健悟 (城西大学) 「Rパッケージの開発・登録とメンテナンス」 パッケージ開発・登録・メンテ・多言語化。 資料。 青木 繁伸 (群馬大学) 「統計学・データ解析におけるRの活用」 R で描けるアニメーション・グラフの紹介。 animation package, rgl package: movie3d(), play3d() 岡田 昌史 (筑
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く