タグ

2012年8月18日のブックマーク (5件)

  • RをEclipseで使う(Mac OSX版)

    @hamadakoichiさんのブログに触発されて、”Eclipse”というIDEを使ってみようと思い立って、EclipseでRを利用するためにインストールに挑戦してみました。 私が利用している環境はMacOS版なので、@hamadakoichiさんのWindows環境の流れでうまくいくかなーと思っていたのですが、Windows版と「ほぼ」同じだったので、無事にインストールできました。 「ほぼ一緒」というのは、メニューがMac特有の配置になっていることがあるので、「ほぼ一緒」という表現にしてあります。 例によって検索してみたところ、日語の説明が少なかったので、もし同じようなことをやりたいという方が参考になるように、まとめておきます。 [参考ブログ] ■hamadakoichi Blog - R を Eclipse で使う →基的な流れは、このステップに従っていれば大丈夫です。 インスト

    RをEclipseで使う(Mac OSX版)
  • GoogleとFacebookではRをどうやって使っているのか?

    ひさしぶりに統計ソフトRの話。 来年こそは仕事でバリバリつかってみようと思っている統計ソフトのR。 前のエントリーでも書いているように、フリーソフトなのに高機能。(統計解析・グラフの種類が豊富) しかし、日語での資料がまだ少ないのがちょっとイタイ…。 (最近は書籍でも多く診られるようになってきましたけどね!嬉しい限りです) ちょうど調べ物をしてたときに、「How Google and Facebook are using R」というエントリーを見つけました。 今日はその内容をちょっと日語に訳した内容を紹介しようと思います。 紹介するサイトこの記事が書かれていたのは、Dataspora Blog というサイトで、データに関する(Big Data, open source analytics, and data visualization)記事をメインに書かれているようです。 (私は知らな

  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • 「子供に解けて大人に解けない問題」を統計的に無理やり解いてみた - ほくそ笑む

    今日は、R-bloggers に面白い記事が上がっていたので、それを紹介してみようと思います。 問題 「子供にはすぐに解けて、大人にはなかなか解けない不思議な問題」をご存知でしょうか? 最近ネットで割と話題になりました。 その問題は、次のようなものです。 8809 = 6 7111 = 0 2172 = 0 6666 = 4 1111 = 0 3213 = 0 7662 = 2 9312 = 1 0000 = 4 2222 = 0 3333 = 0 5555 = 0 8193 = 3 8096 = 5 7777 = 0 9999 = 4 7756 = 1 6855 = 3 9881 = 5 5531 = 0 2581 = ? https://twitter.com/#!/yappyJP/statuses/172086299099004928 なかなか面白い問題です。 答えはここでは書きませ

    「子供に解けて大人に解けない問題」を統計的に無理やり解いてみた - ほくそ笑む
  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む