『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、
あけましておめでとうございます。 本年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *
今回初めてR勉強会@東京に参加してきました。 結構前(1年ぐらい?)から開催されている勉強会に途中から参加、しかもRは素人とドキドキでしたが、楽しく勉強できました。 なにげに大森駅に降りたのも初めてだったような気もします。 Rによる回帰分析入門 [twitter:@yokkuns] Rによるデータサイエンス第Ⅱ部 第7,8章 回帰分析 データ解析の基本である回帰分析について、Rを使って学んでいきます。 残差の正規Q-Qプロットで正規分布に準じているかどうかを確認できる 重回帰分析で使うファクターを自動選択する関数step。モデルはAICで評価される。これは使えるかも。 AIC(Akaike's Information Criterion:赤池情報量規準) 統計モデルを評価するための指標 小さい方がよい step関数で自動選択 欠損値の扱いをどうするべき? ケースバイケースだが、使わなくて済
This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.
第1回 Japan.R 午前の部 使用したスライド NEW!! その1:http://www.slideshare.net/sakaue/japanr-11-5929073 その2:http://www.slideshare.net/sakaue/japanr-12 その3:http://www.slideshare.net/sakaue/japanr-13 事前にダウンロードしておくとよいソフト R 2.12.0 Windows: http://cran.md.tsukuba.ac.jp/bin/windows/base/ 「Download R 2.12.0 for Windows」をクリック Mac: http://cran.md.tsukuba.ac.jp/bin/macosx/ 「R-2.12.0.pkg (latest version)」をクリック Linux: http://
Machine Translation, Speech Recognition, Machine Learning, and the like. On twitter a little while ago, @mathieuen asked an interesting question about whether the fact that he was seeing support vector machines (SVM) get better precision than logistic regression (LR) was a result of the learning algorithm (specifically the hinge loss function). I answered off the top of my head that I thought that
最近、Rの非効率性やパフォーマンスの悪さをここで良く取り上げていて、それじゃあ柏野はRが嫌いなのか、と誤解されることもあると思うので、その弁明を。 僕にとってRはかなり好きなコンピュータ言語だ。使っていてワクワクする。言語を使いながらマイナーな分野の統計学の勉強ができるフリーソフトウェア / オープンソースソフトウェアの言語なんて他には存在しない。最近ではCRANにあるevirやismev, evdを利用して極値統計学を勉強した。 クイックなプロトタイピングができるのも本当に素敵だ。よくわからないデータを探索的に調べていくためには最高のブッシュナイフだと思う。だからこそ、@ITで市井の知識労働者を対象とした連載をしている。 実践! Rで学ぶ統計解析の基礎 http://www.atmarkit.co.jp/fcoding/index/stat.html しかし、エンタープライズレベルに必要
こちらの話。 Rを使ってYahoo!乗換案内から運賃や所要時間,乗換回数を取得するコード書いた - Fire and Motion Rubyでもなく、Perlでもなく、Rでスクレイピングしようというコンセプトがすばらしいです。熱い。 あちらのサイトではスクレイピング部分が結構大変な事になってるので、Rでももっと簡単にスクレイピングできるよ!と思ってちょっと書いてみました。 あとは個人的な趣味として、for文とかif文を使わないでapply系をつかってます。やっぱりRの醍醐味はapplyでしょう(?)。 library(scrapeR) #出発駅と到着駅ベクトル station1 <- c("渋谷","表参道", "外苑前", "青山一丁目", "赤坂見附", "溜池山王", "虎ノ門", "新橋", "銀座", "京橋", "日本橋", "三越前", "神田", "末広町", "上野広小路
Tsukuba.Rは明日なんですが、発表する資料をBlogに上げておきました。発表の時はスクリーン、もしくは、Blogの資料を見てもらうという形にしようと思ってます。たぶん、今日上げても明日上げてもあんまり価値が変わらんと思うし、明日は会場準備があるので、はてだに上げてる時間があるか分からないので。ust経由で見る人とかは字が見えない恐れがあるので、こういう風にしたほうがいいかなーとか思いました。 自己紹介とTsukuba.Rの概要→最後に張る Good point for using R Rにおけるぐぐり方 Rの基本データ構造、よく使う関数紹介 Rを使った統計勉強法【中心極限定理編】 apply familyの紹介 時間が余った時用のネタ→当日時間が余ったら張る
統計分析ソフトウェア R のための検索エンジンです。R 言語に関する内容に特化した検索結果を表示します。
ページの最後尾に掲示板を付けています。聞きそびれたこと,直接関係ないけど知りたいことを気軽に書き込んでください data(iris) # 組み込みデータの読み込み(R. Fisherのアヤメのデータ) dim(iris) # 行数,列数の確認 print(iris) # データ閲覧,単にirisと打ち込むだけでもいい fix(iris) # グラフィカルにデータを修正(あんまり使わないほうがいい) summary(iris) # 要約統計量 pairs(iris[-5]) # 散布図行列のプロット cor(iris[-5]) # 相関行列 あきらかにいくつかの群に分かれている アヤメの品種(Species)別に見てみる sp <- levels(iris$Species) # 変数の水準を取得 # 水準ごとに散布図行列をプロット pairs(~ Sepal.Length + Sepal.W
観測、実験、調査では、通常個体の属性を複数の項目(変数)に分けて記録する。変数が少ない場合は、簡単なグラフや基本統計量などでデータの構造を明らかにすることができるが、変数が多くなるとデータの構造が複雑になり、解析が難しくなる。一方、変数が多くなると変数の間には相関がある可能性も増える。 主成分分析(principal component analysis)は、多くの変数により記述された量的データの変数間の相関を排除し、できるだけ少ない情報の損失で、少数個の無相関な合成変数に縮約して、分析を行う手法である。主成分分析の手法はホテリング(Hotelling)によって1933年頃提案された。 変数が1つ、2つの場合は、棒グラフや散布図でデータの構造を読み取ることが可能であり、主成分分析を行う必要がないが、主成分分析の考え方を説明するため、ここでは2変数の場合の例を用いることにする。 たとえ
R first appeared in 1996, when the statistics professors Robert Gentleman, left, and Ross Ihaka released the code as a free software package.Credit...Left, Stuart Isett for The New York Times; right, Kieran Scott for The New York Times To some people R is just the 18th letter of the alphabet. To others, it’s the rating on racy movies, a measure of an attic’s insulation or what pirates in movies sa
RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですRjpWiki はオープンソースの統計解析システム 《R》 に関する情報交換を目的とした Wiki です † どなたでも自由にページを追加・編集できます. (初めて投稿・既存記事への追加・修正を行なう方はこのページ末の注意*1を御覧下さい) ページへのファイル添付については、画像ファイルのみパスワードなしで可能としてあります(ページ上部「画像添付」より)。その他のファイルの添付はパスワードを入力することで可能です(ページ上部「ファイル添付」より)。現在のパスワードは, Rでの round(qt(0.2,df=8),3) の実行結果です。 スパム書き込みに対処するため、書き込み系の処理に対してパスワードを設けました。ユーザ名の欄には,Rで round(qt(0.2,df=8),3) を実行
「RってTwitterで遊ぶためのものなのか」とか思われるとあれなので、ちょいまじめネタで行くことにします。「株価データの収集、基本的なデータの解析、株価の予想モデルの作成まで全部Rでできちゃうよ」編です*1。 とりあえず、株価データの収集をしてくる関数から。infoseekのファイナンスのところから取ってきてます。 finance <- function(site){ ruby <- paste(" #!/usr/bin/ruby -Ke # -*- coding: utf-8 -*- require %q[rubygems] require %q[mechanize] require %q[kconv] finance = \"",site,"\" agent = WWW::Mechanize.new agent.max_history = 1 page = agent.get(fin
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く