【第2回データマイニング+WEB 勉強会@東京】 #TokyoWebmining - 「はじめてでもわかる R言語によるクラスター分析」、に関連するTweetをまとめました。
Warning Here are the notes I took while discovering and using the statistical environment R. However, I do not claim any competence in the domains I tackle: I hope you will find those notes useful, but keep you eyes open -- errors and bad advice are still lurking in those pages... Should you want it, I have prepared a quick-and-dirty PDF version of this document. The old, French version is still a
ページの最後尾に掲示板を付けています。聞きそびれたこと,直接関係ないけど知りたいことを気軽に書き込んでください data(iris) # 組み込みデータの読み込み(R. Fisherのアヤメのデータ) dim(iris) # 行数,列数の確認 print(iris) # データ閲覧,単にirisと打ち込むだけでもいい fix(iris) # グラフィカルにデータを修正(あんまり使わないほうがいい) summary(iris) # 要約統計量 pairs(iris[-5]) # 散布図行列のプロット cor(iris[-5]) # 相関行列 あきらかにいくつかの群に分かれている アヤメの品種(Species)別に見てみる sp <- levels(iris$Species) # 変数の水準を取得 # 水準ごとに散布図行列をプロット pairs(~ Sepal.Length + Sepal.W
最近Office Professionalを買ったので,近頃はもっぱらOfficeで遊んでいる.Officeはちょっとバグとか多くて難しいから,よく勉強をして早く初心者を脱出したい. で,ここ2〜3日はExcelからRを呼ぶ方法をいろいろ調べていた.やっぱVBAちょっとくらい勉強しないと駄目かなとか思い始めた頃,RExcelというExcelのアドインを見つけた(statconn).これを使うと結構実用的なレベルでExcelとRを連携させられそう*1. RExcelのインストール まず,rscproxyとrcomの2つのパッケージをRから入れておく.下の二行はRExcelのインストール時にやれっていわれたからやった*2. install.packages("rscproxy") install.packages("rcom") library(rcom) comRegisterRegistr
あまり統計に明るくないワタクシですが、これを機に勉強しようと思い立ち、Rの勉強会に行ってきました。 http://atnd.org/events/3054 当日は、id:yokkunsが検定の説明をしてくれました。 ちなみに、ボク自身は統計が苦手。なぜ苦手なのかを考えると、非常に天下り的なものを感じるからです。 他の学問や分野だと、イチから積み上げている感じがするのに、統計に関しては、すでに分布があって、それをどうやって使うか、と言うところに主眼があって、なんでその分布になるのか、もしくは、その分布をどうやって発見したの? と言うところが抜けているので、あまり好きではありませんでした。 と言うことで、ボクがもう一段階進むためには、そういうところの仕組みを知る必要があるかなぁ、と思っています。 詳しくは、主催者のブロクを参照。 http://d.hatena.ne.jp/yokkuns/20
ニューラルネットワークについて プログラム データの準備 モデル式の作成 結果の表示 予測値を得たい ヘッセ行列の固有値を見る ニューラルネットワークを可視化する 追記 nnetとかをもうちょっと 最適化とかヘッセ行列がらみの話 ニューラルネットワークについて先週のPRMLでNNことニューラルネットワークについて勉強を始めました。PRMLは主に理論についての本なので、「ふーん」という感じなんですが、読書会後に「NNって(一定制約の元で)任意の関数に近似できることが証明されてるんだぜ?」とか言われると中二病患者の俺としては「?!NNってすごくね?てか、そんなすごいんだったらNNだけでいらなくね?他のモデルいらなくね?」とか思ってしまいます。しかし、直後に あくまで近似。どれくらいの精度かはものによる 近似できないものも存在する*1 と教えてもらったので、他のモデルもちゃんと勉強する価値がある
Open Source の統計解析・データマイニング環境である R。 R を Eclipse で使用するための環境構築法、使用方法を以下に紹介する。 参考:A guide to Eclipse and the R plug-in StatET (Longhow Lam, PDF) ※ここでは、R 2.10.1, Eclipse 3.4.2 を例に挙げる。 R, Eclipse のインストール 1.R のインストール・環境設定: R のインストール・環境設定 2.Eclipseのインストール: Eclipse.org: http://www.eclipse.org/ Pleiades (All in One Eclipse) :http://mergedoc.sourceforge.jp/ Eclipse にR plug-inのインストール 1. Eclipseを起動。 2. Help ->
楽しすぎる統計・データ解析用言語 R の欠点は,Googleで検索しにくいことである。 そのRに twitteR というTwitter APIを操るパッケージができていた。これまた楽しい! 使い方の例: install.packages("twitteR") library(twitteR) userTimeline("h_okumura") # 例 sess = initSession("h_okumura", "パスワード") tw = tweet("MacのRならtwitteRで化けないのかな", sess) # もし化けたら deleteStatus(tw, sess) する 詳しい使い方はvignetteやreference manualを見ればわかるが,実例がほしい。しかし残念なことに,Google検索ではtwitteRもTwitterも同じと扱われてしまう。Twitterで教
先日、R勉強会@東京のLTで紹介した、Rパッケージの「RFinanceYJ」をCRANに登録しました。 CRAN - Package RFinanceYJ 登録の手順は、本当に簡単で、ftp://cran.r-project.org/incoming にアップロードしてcran@r-project.org にその旨をメールするだけです。 PHPのPEARやPerlのCPANなどに比べて、すごく敷居は低いと思います。 以下、インストールと使い方です。 インストール install.packages("RFinanceYJ") library(RFinanceYJ) RFinanceYJは、XMLに依存してます。これのインストールでハマった時は以下を参考にすると良いかも知れません。 http://www.okada.jp.org/RWiki/?R%A4%C8XML#z0d34610 使い方 ソ
RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki です利用方法 † RSOAPは、「サーバマネージャ」サービスと「サーバプロセス」サービスの2種類からなり、まず「サーバマネージャ」サービスに接続し、そのnewServerメソッドを呼んで「サーバプロセス」サービスのURLを得る。その後「サーバプロセス」サービスに接続し、主にcall, evalメソッドを用いて解析を実行する。 ↑ MacOS X のAppleScript?から呼んだ例 † -- サーバマネージャサービスのURLがlocalhost:9081のとき tell application "http://localhost:9081/" set returnValue to call soap {method name:"newServer", ¬ method namespace ur
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く