タグ

Rに関するshowyouのブックマーク (70)

  • Hatena ID

    Hatena ID is an account used for various Hatena services.

    Hatena ID
    showyou
    showyou 2011/05/30
  • Rでクロス集計表の残差分析 - bob3’s blog

    ぼやーっとツイッターを眺めていたら、[twitter:@R_Linux]先生のツイートが目に留まった。 んん、ということはクロス集計表の残差分析がさくっとできそうだな。 クロス集計表の残差分析はあまりメジャーではないかもしれませんが、χ二乗検定の下位検定として位置付けられています。 端的に言うと「ある一つのセルの観測値が期待値に比べて有意に大きいか小さいか」を検定する手法です。 詳細な解説は下記を参照してください。 群馬大青木先生による解説 雪さんによる解説 Rでの残差分析には id:langstat さんも挑戦しています(id:langstat:20110319)。 青木先生謹製の関数もあります。 カイ二乗分布を用いる独立性の検定 ただ、どちらも調整済み残差を出力するところまでに留まっているので、ここではp値の算出と多重比較によるp値の調整までを行ってみたいと思います。 サンプルデータ

    Rでクロス集計表の残差分析 - bob3’s blog
    showyou
    showyou 2011/05/21
  • RStudioがすごそうなので使ってみた - As a Futurist...

    最近出たプロダクトで「RStudio」というのがあるんですが、試しに使ってみてあまりにも洗練されてて感動したのでエントリにしました。 RStudio って何? そもそもなにするものかというと、統計分析・グラフ作成プログラミング言語である R の IDE みたいなもので、PC 上でスタンドアローンで動かすこともできますし、サーバ上のリソースをブラウザ越しに扱うこともできます。スタンドアローンの方はすでに WindowsMac などひと通りバイナリありますし、サーバの方も Ubuntu/CentOS はバイナリあって楽々使えるようです。 ちなみに最初 Amazon Linux で動かしてみようと思ってたんですが、Amazon Linux は微妙にパッケージを新しくした CentOS みたいな感じなので各所でライブラリのバージョンがずれてて依存関係で破滅的になりました。だったら make

    RStudioがすごそうなので使ってみた - As a Futurist...
    showyou
    showyou 2011/03/05
  • Revolution Analytics - 統計用言語Rの商用化

    Rustが再評価される:エコシステムの現状と落とし穴 In this article, we share findings and insights about the Rust community and ecosystem and elaborate on the peculiarities and pitfalls of starting new projects with Rust or migrating to Rust from othe...

    Revolution Analytics - 統計用言語Rの商用化
  • OAuth.R

    OAuth.R u , V 0� , V # {{{ OAuth.R.License <- 'Copyright (c) 2010 OZAKI Toru (twittoru) Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies

    OAuth.R
    showyou
    showyou 2010/09/22
  • インターリュード: TwitterとR

    今回はTwitterという身近な題材を使って、Rによるデータ収集と可視化をやってみます。Rの豊富なライブラリを使えば意外に手軽にできます。 今回は間奏的にIT寄りの話題を この連載は@ITの連載でもかなり毛色の違う内容です。それにもかかわらず前回までの4回は、統計的検定をいきなり導入したり、日政府や世界銀行の経済統計にアクセスしてみたり、さらにはWikiLeaksの暴露データを統計解析してみたりと、かなりハードコアな内容に走ってしまいました。 第4回の「あとがき」では同じ路線で突っ走ろうということを申し上げていたのですが、今回は間奏(インタリュード)として、より@ITらしく、IT寄りの話題を取り上げたいと思います。 TwitterとR Twitterの人気は世界的にまだまだ続いているようです。2010年8月後半に発表された2010年6月分の統計によれば、現在はインドネシアやブラジル、ベネ

    インターリュード: TwitterとR
    showyou
    showyou 2010/09/16
    twitteRってOAuthで使えたっけ?これ試した人いるの?→やはり使えないっぽい
  • R-Source

    作業ディレクトリの変更 ファイルからデータやプログラムを読み込んだり,ファイルにデータを書き出したりする場所を作業ディレクトリという.起動時はホームディレクトリ( R の実行ファイルがある場所)が作業ディレクトリとなっているが,以下のような命令を与えると,これ以後,指定したディレクトリに指定した作業ディレクトリにデータがセーブされたり,R 用エディタなどが保存されるようになる 関数 dir() で作業ディレクトリ内のファイルが表示される. Windows では \ を指定しては駄目.例えば,setwd("c:\usr") とするとエラーが出る.setwd("c:/usr") とするか setwd("c:\\usr") こと. Windows の場合,メニューの [ファイル] から [ディレクトリの変更...] を選択してから,ディレクトリを変更することが出来る.

    showyou
    showyou 2010/06/04
  • R -- 主成分分析

    主成分分析     Last modified: Aug 02, 2009 目的 主成分分析を行う。 R には,princomp および prcomp という,二種類の関数が用意されている。 しかし,これらが返す「loadings」は固有ベクトルそのものであって,いわゆる負荷量ではない。 そこで,princomp2,prcomp2 という関数を書いたので,そちらも参照してみるとよい。 使用法 pca(dat) print.pca(obj, npca=NULL, digits=3) summary.pca(obj, digits=5) plot.pca(obj, which=c("loadings", "scores"), pc.no=c(1,2), ax=TRUE, label.cex=0.6, ...) 引数 dat データフレームまたはデータ行列(行がケース,列が変数) obj pca

    showyou
    showyou 2010/06/01
  •  Rで二項分布のグラフを書く - コンテキストをマイニングするツールを作る

    二項分布を計算するRの関数 二項分布って、結局”成功”の確率と言えるかも。つまり、サイコロを振って5と6が出るのを”成功”と定義する。とか、ある現象の成功をまず定義してしまう。そして、何回もトライしたとき、何回位が成功するかを考えるというモデルである。 二項分布を計算する組み込み関数は以下。参考サイトはここ。 dbinom(x, size, prob) # x : ベクトル, prob : 成功の確率 pbinom(q, size, prob, lower.tail = TRUE) # q : quantile のベクトル qbinom(p, size, prob, lower.tail = TRUE) # p : 確率ベクトル rbinom(n, size, prob) # n : 観測数, size : 試行数 とりあえずdbinom関数を使えば良いみたい・・・。例えば、成功確率が0.

     Rで二項分布のグラフを書く - コンテキストをマイニングするツールを作る
    showyou
    showyou 2010/05/24
  • RMeCab - アールメカブ

    _ 基 2022 年 05 月 02 日 RMeCab_1.10 for R-4.2.0 (64bitUTF-8のみ対応) 公開 2022 年 04 月 29 日 RMeCab_1.08 for R-4.2.0 (64bitUTF-8のみ対応) 公開 2021 年 11 月 27 日 M1 MacOSX 用の注意を追記 2021 年 05 月 27 日 RMeCab_1.07 for R-4.1.0 (M1 Mac 用バイナリを追加で作成) 公開 2021 年 01 月 11 日 RMeCab_1.06 for R-4.0.3 (MacおよびLinuxでは辞書としてneologdを指定できるようになりました) 公開 R と MeCab? (ただしWindowsでは64bit UTF-8辞書版)の両方が既にインストールされているのならば R を起動し、コンソールで以下を実行すればRMe

    showyou
    showyou 2010/05/14
  • Rの文字列処理関数 - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki です2010-05-13 パッケージの紹介書籍を作りましょう R AnalyticFlow CRANパッケージリスト Q&A (初級者コース)/12 GoogleEarthとR RとPostGIS R と UML RecentDeleted 2010-05-12 R出力の記録 64bit Windowsでのパッケージのインストール SQLite 里 洋平 2010-05-11 R running on mobile gadgets base(基)パッケージ中のオブジェクト一覧(ABC順) Rでベイズ統計学 R史 トップ頁へのコメント R掲示板 2010-05-10 Q&A (中級者コース) Rがインポート・エクスポートできるデータ形式 2010-05-06 Rの基パッケージ中の多変量解析関数

    showyou
    showyou 2010/05/14
  • Home - Department of Statistics - Purdue University

    Department of StatisticsThe department of statistics is consistently recognized as one of the top statistics programs in the country. We work to advance the frontiers of statistical sciences and data science both in theory and application. New directions in statistics are often interdisciplinary and encompass bioinformatics and genomics, computational finance, data science, differential privacy, a

    showyou
    showyou 2010/05/12
  • Rでベータ分布

    PRMLも再読してるが、手動かしながら読むほうがしっくりくる。 p.70のベータ分布の逐次学習ってのが面白そうなのでやってみた。 data <- rbinom(30,1,0.5) plot_dbeta <- function(data){ a <- 0 b <- 0 x <- seq(0.01, 1.0, len = 500) for (i in 1:length(data)) { if(data[i] == 1) { a = a + 1 } else { b = b + 1 } if(i>3){ if(i==4){ plot(x, dbeta(x,a,b),type = "l",col=i,ylim=c(0,5)) } else { plot(x, dbeta(x,a,b),type = "l",col=i,xlab="",ylab="",axes=F,ylim=c(0,5)) } pa

    Rでベータ分布
  • Rのtwitterクライアント使ってフォローしている人を分類してみた - sheephead

    Rのtwitterクライアント使ってフォローしている人を分類してみた 2009.07.27 【統計】R twitter ESS, google, twitter, ubuntu とりあえず使ってみる というわけで、早速インストール。ちなみに、ubuntuの場合は、Rcurlのインストールにlibcurl4-gnutls-devがいるみたいなので先にapt-getでいれときましょー [cpp] install.packages("RCurl") install.packages("twitteR") [/cpp] 使うときに少しハマったのがproxyの設定。実はtwitteRではproxyの設定ができないのです。ただ、twitteRで設定を保存するinitSession()は、RcurlのgetCurlHandle()のラッパーなので、getCurlHandle()でproxyを設定すれば良

    Rのtwitterクライアント使ってフォローしている人を分類してみた - sheephead
  • R言語でモンテカルロ法 - necoffeeのにっき

    前回の記事でPythonを使ったモンテカルロ法によるπの導出を、今度はR言語でやってみた。 > montecarlo <- function(n) { + count <- 0 + for(i in 1:n) { + s <- runif(2) + if(sqrt(s[1]^2 + s[2]^2) < 1) { + count <- count + 1 + } + } + return(4*count/n) + } 実行結果例: > montecarlo(100) [1] 3.2 > montecarlo(1000) [1] 3.108 > montecarlo(10000) [1] 3.1196 グラフを描いてみる: >x <- runif(10000) >y <- runif(10000) > plot(x, y, pch = ifelse(sqrt(x^2+y^2)<1, 20, 1

    R言語でモンテカルロ法 - necoffeeのにっき
    showyou
    showyou 2010/05/12
  • RでRandomForest

    朝からRをいじりたくなって、「あーそういえば2.8出たんだっけ」とか言いながら、ソース落としてきてmacbookでコンパイルをしてみたがこけた。まぁ、2.7.1でRpy動くのでとりあえずいまのところはそっとしておいてやろうということで負けを認めない方向で。 で、RandomForestは好きな時に使えるようになっておかないといけないなぁといつもお世話になっている連載を読み直した。というより、いままで上っ面を押さえただけでわかった気になっていただけだったので、ちゃんと読んだ。 与えられたデータセットからN組のブートストラップサンプルを作成する。 各々のブートストラップサンプルデータを用いて未剪定の最大の決定・回帰木を作成する。ただし、分岐のノードはランダムサンプリングされた変数の中の最善のものを用いる。 全ての結果を統合・組み合わせ(回帰の問題では平均、分類の問題では多数決)、新しい予測・分

    RでRandomForest
    showyou
    showyou 2010/05/09
    RandomForestは便利らしい
  • RWebUI

    RWebUI is a Web-based interface for R statistical computing environment. Prototype SF.net © 2010 RWebUI Project. - Twitter

    showyou
    showyou 2010/05/09
  • ggplot2についてちょっと勉強した(1) - もうカツ丼はいいよな

    ggplot2について ggplot2 要するにRでちょっとカッコイイグラフが簡単に作れるアレ。 リファレンスマニュアルを読んだのでノートを書く。 とりあえずhttp://had.co.nz/ggplot2/geom_abline.htmlを読んだ。点の打ち方と線の引き方。 まあでもぶっちゃけhttp://had.co.nz/ggplot2/geom_abline.htmlを省略しつつ訳しただけのようなものなのであまり面白くn*1(ry ノート 使われるデータセットについて 自動車のデータ ?mtcars 1974年のMotor Trend US紙から抽出 燃費ほか10の項目、32車種分のデータ mpg: 燃費(Miles/(US)gallon) cyl: シリンダー数 disp:排気量(立方インチ?) hp: 馬力 wt: 重量(ポンド/1000) qsec:1/4マイルのタイム vs:

    ggplot2についてちょっと勉強した(1) - もうカツ丼はいいよな
    showyou
    showyou 2010/05/09
  • Beautiful woRld

    The document introduces R and provides URLs for R resources. It discusses R's use for data manipulation, statistical analysis, and data visualization. URLs listed include the main R project website, CRAN mirrors including one at Tsukuba University, Japanese wiki and tutorial pages for R, and suggestions to use Twitter and blogs to find additional R information online.Read less

    Beautiful woRld
    showyou
    showyou 2010/05/09
    Rの便利なURL集
  • RとDBMS

    Working with large archives in AtoM in National Library of WalesVicky-Phillips

    RとDBMS
    showyou
    showyou 2010/03/27