…旧版は下部… 1日30分くらい,30日で何とかRをそこそこ使えるようになるための練習帳 改め 「そこそこRが使えるようになるための練習帳」 下部の練習帳を作ってから,ずいぶんたちました。Rのバージョンアップも進み,情報が古くなったところもあります。授業でも,少し使いにくくなってきました。 そこで,コンセプトや内容はほぼそのままに,新しいバージョンに対応し,いくつか必要だろうなと感じていた情報も新たに加えたものを作成しました。 私自身は,Macユーザーなので,Mac版の「R」(3.5.2)をベースに作成しています。別途Win版を作成するかどうかは未定です…。多くの部分は共通なので,Windouwsユーザーも以下の資料で問題ないのではないかと思います。Win特有の点が含まれる日もありますので,その際は旧版も参照してください。 あと,他のサイトでしっかりと説明がされている,ダウンロードやセット
概要 ・PythonとRを連携させることで、PythonからRのコードを実行させる ・統計的な分析はRに、データのハンドリングなどはPythonに任せるのが現時点での最適解か ・この記事はR Advent Calendar 2014(https://atnd.org/events/58648)の12/10用の記事です モチベーション 専らRやPythonはトレーディング戦略のシミュレーションに用いているわけですが、たまには統計的な分析結果をもとにトレードする戦略などを考える時もあります。 シミュレーションの本体はPythonで構築しているので、自ずとPythonで統計分析モジュールも構築する必要があるのですが、これがなかなかかゆいところに手が届かない。 (scikit-learn?知らない子ですね。) やはり餅は餅屋ということで、統計分析はRに任せたい。 というか今まで培ってきたRのノウハ
はじめに 前回, 大相撲のデータを正しく作るのが辛い, ということを書きました. Rでスポーツデータ解析がしたい: データを作るのって大変ですね - 300億円欲しい まだ整形できていないのですが, 現段階で可能な解析をしたいと思います. 八百長問題が気になりますので, 千秋楽の勝率を集計してみます. 先行研究 大相撲のアノーマリー. 2010年に書かれた記事です. 八百長がありそうかどうか, という解析です. 実践! Rで学ぶ統計解析の基礎(8):大相撲のアノーマリー (2) (2/2) - @IT もしも、この計算の追試や、何らかの追加計算をされた方がいらっしゃったら、是非ともその結果を教えてくださることを熱望します。 また、1999年以前10年間程度の十両・幕内の勝敗データを持っていらっしゃる方がおりましたら、そのデータを提供いただければ、より一層踏み込んだことが分析できると思います
ドーモ、親愛なる読者のみなさん。うんようチームです。 というアイサツをしたいがために、ブログ書きます!と名乗り出てしまった運用本部の湯谷(@yutannihilation)です。今回は、R Advent Calendar 2014 9日目の記事として、Webサーバのレスポンスタイムをざっくり可視化する方法を紹介します。 使うもの R Rは、統計解析に特化したプログラミング言語です。 サイボウズ社内にも、手元でデータを解析するツールとしてRを活用している人が多くいます。部署横断の社内勉強会が毎週開催されていて、Rや統計の情報交換やデータ分析の悩み相談をしています。 今回は、世のデータサイエンティストが駆使していそうな華々しい統計手法とは無縁の、地味にグラフを描くだけの話です。統計とか機械学習っぽい話は、いずれ知る人ぞ知る中谷さんが書いてくれるのではないかと勝手に期待しています。 ggplot
先日,比治山大学で行われたHijiyama.Rで発表したスライドを,スライドシェアにアップしました。 内容は,タイトルの通り,Rのpsychパッケージで因子分析をするための方法についてまとめています。特に,SPSSなどの商用ソフトではできない,きめ細やかな分析法について触れています。 また,以下にスライドで使っているRコードをまとめて書いておきます。 library(psych) library(GPArotation) data(bfi) dat <- bfi[1:25] #MAPや情報量規準を推定できる summary(VSS(dat,n=10,use="complete.obs")) #平行分析のコード fa.parallel(cor(dat, use="na.or.complete"), n.obs = 2436, n.iter = 50) #リストワイズ削除したデータのサンプルサ
石井准教授の作成した「統計解析ソフトRのスクリプト集」をオンラインで公開します。名古屋大学教育学部の「心理・教育の統計学」の授業で実際に使用されている教材です。学習・研究にご活用下さい。 2016.4.5 Ver. 4.0βを公開しました。棒グラフオプション、オメガ係数、効果量、標本サイズの推定などの記述が加わりました。 2015.3.18 Ver. 3.0βを公開しました。記述統計量の算出の部分を統一的にしたのと、データ例を書籍にあわせて変えています。 2014.11.4 Ver. 2.2βを公開しました。 統計解析ソフトRのスクリプト集 (PDF) 下記のサイトでは、シラバスと講義資料が公開されています。あわせてご活用下さい。 「心理・教育の統計学」(名大の授業) 講義資料 (PDF) ーーー はじめに 石井秀宗 この冊子は,心理学や教育学の研究でよく用いられる統計手法に関して,統計解
統計解析ツールRを使ったエンジニア向けデータマイニング講座後編。機械学習の1手法である決定木を用いて、事例を基にデータマイニングを実践していきます。エンジニアとしてのキャリアアップを考えている方にピッタリのデータマイニング連載企画最終回です。 ここまでのあらすじ「山田とデータマイニングとR」 前回は、ウェブ系のエンジニアの山田君がデータマイニングを始めるきっかけをお話ししました。 ―Rを学ぼう!エンジニア向けデータマイニング講座|freee 坂本登史文【初めの第一歩編】 無事にRとMySQLを接続し、うまくヒストグラムを描くことができました。 今回は、山田君がデータマイニングを始めるきっかけとなった「どのような属性のユーザーが課金をしてくださっているのか」ということを、機械学習の1手法である、「決定木」という手法で明らかにしていきたいと思います。 さて、山田君はうまくデータを分析して、サー
こんにちは。オソブサ*1でおなじみの林です。お盆なのでBON JOVI聞いています*2。論文はまだ書けていませんけど何か。 さて。さいきんTokyo.Rの和田計也さんという方のちょう素晴らしいプレゼンファイルを拝見いたしました。 そろそろRStudioの話でもしてみようと思う そこでRStudioからレポートを自動作成できるknitrというツールが紹介されていたので、自分でも少しいじってみました。今回はその自習のまとめも兼ねてここにも書いてみたいと思います。 そもそも:Rの結果をどうやって保存してます? ええと。まずそもそもの問題意識なのですが、みなさまはRでの計算結果ってどう保存してますか? これって結構メンドクサイ問題で、いままで私は基本的に: テキスト系のアウトプットはテキストファイルへ書き出し(またはコンソールからコピペ) 画像系のアウトプットはpng/PDFなどへ書き出し してい
R は統計解析向けのプログラミング言語で、お手軽にデータ分析を行うことができます。そして、R での分析結果は、Shiny というR のパッケージを使うことで、簡単にWeb アプリ化することができます。今回はR プログラムを簡単にWeb アプリ化するShiny パッケージと、Web アプリとして公開することができるShiny Server について紹介します。 What's Shiny? Shiny とはR のIDE である RStudio の開発元のRStudio Inc. が開発しているプロダクトです。Shiny を使うとR のプログラムを簡単にWeb アプリにすることができます。 Shiny で作成したWeb アプリはブラウザからのユーザー入力などをトリガーに、インタラクティブにR のプログラムを即時実行し、その実行結果を動的に確認できます。見た目に関しては、Shiny が内部的に T
第42回Tokyo.Rを開催しました! https://atnd.org/events/54680 今回は、いつもと違って、Y!Jのでの開催で、 株式会社Qubital(キュービタル)データサイエンスさんの社員の方々がスタッフをやってくださいました。 ありがとうございます!! 前半セッション R入門(dplyrでデータ加工):@gepuro R入門(dplyrでデータ加工)-TokyoR42 from Atsushi Hayakawa ggplot2によるデータ可視化:@yokkuns Tokyor42 ggplot2 from Yohei Sato Rコードと実行結果:http://rpubs.com/yokkuns/27108 データ分析するときの4つの視点:@yokkuns Tokyor42_r_datamining_18 from Yohei Sato Rコードと実行結果:http
コミケとは関係ない別ネタです. 青空文庫からファイルを(半)自動ダウンロードでテキストマイニング(したい?) 日頃,いわゆる初心者相手にデータマイニングやテキストマイニングのやり方とか説明する仕事をしております. お相手はデータマイニングで食っていくとかではなく,まあ,とりあえず言われたのでやってみる,程度のモチベーションの方々です. モチベーションに関係なく,俺が使うのはRなので,彼らにも当然Rを使ってもらいます. それで最近はテキストマイニングねたなどを所望されるので,とりあえずどんなことができるのかを実演しています.参加者にも手を動かしてもらって,時間を稼いだりもします.まあ,だいたい理論的なことはすっ飛ばし,以下の作業をやってもらったりしているわけです. 青空文庫からファイルを zip でダウンロード 解凍 ルビを取り去る 形態素解析 頻度行列に変換 R と必要パッケージをインスト
http://perfdynamics.blogspot.com/2014/07/restaurant-performance-sunk-by-selfies.html 1 comment | 0 points | by WazanovaNews ■ comment by Jshiike | 約5時間前 Performance Dynamicsのブログで、PDQ(Pretty Damn Quick)モデルを利用して、Rでレストランのパフォーマンスを試算した話を紹介しています。 データの元はこちらの記事。NYの老舗レストランが、10年前と比較して、1日当たり同じ数の顧客を対応しているのに、サービスが遅いとのクレームが増えているため、店内の監視カメラで録画したスタッフの動きを比較して分析。その結果、店内の無料Wifiのつなぎ方の問い合わせやつながりづらいというクレームへの対応、顧客がスマホで
これまでデータ・サイエンティストの選ぶプログラミング言語はRだったのだが、急激にPythonに置き換わろうとしている。 このシフトの理由はいくつかあるようだが、第一にはPython自体が汎用的で比較的学びやすい言語であるのに対し、Rが習得するにあたってやや複雑であることがあげられるだろう。 データにますます依存しつつある現代社会とデータに飢えたサイエンティストにとっては「簡単さ」こそが鍵となるのだ。 Rは実際にはプログラミング言語ではないRを覚えることに苦労する人が多い理由として考えられるのは、Rが実際にはプログラミング言語ではないからかもしれない。R専門家のジョン・クックいわく、Rとは「統計のためのインタラクティブな環境」であり、厳密にはプログラミング言語ではないのだ。彼はさらに「Rをプログラミング言語だと考るのではなく、Rがプログラミング言語を内包しているのだと考えた方が良いと分かった
マーケティング施策や商品開発の糸口を発見する為に購買履歴データでネットワーク分析を行っているのだが、今年に入りノードやエッジの数が多い隣接行列を取り扱うようになってきた。といってもまだまだビッグデータとはいいがたいが。。。cytoscapeにくわせOrganicレイアウトで表示するとこんな感じです。(他の設定はデフォルト) 今後はもっとデータ量が多くなりそうなので、ネットワーク分析をもうちょっと勉強。 これまで参考にしていたのはRで学ぶデータサイエンスの#8ネットワーク分析。R+igraphで中心性指標を計算したり、コミュニティの抽出などはさくさくできる。会社の先輩に話をすると、もっと勉強になる資料があるよと九州工業大学の竹本先生の資料を教えてくれた。2013/3/8に開催された第2回 Rでつなぐ次世代オミックス情報統合解析研究会で発表された資料らしい。タイトルは「R+igraphではじめ
本連載ではTIS株式会社が提供している技術ブログ「Tech-Sketch」から「コレは!」というテーマをピックアップし、加筆修正して皆様にお届けしております。今回は、最近注目が集まっている統計解析向けプログラミング言語であるR言語(以下R)、そのオープンソースパッケージであるrChartsを紹介します。データ解析を行いたい場合、Rは非常に強力なツールです。しかし、実際に出力したRのグラフの見た目については、何か物足りなさを感じます。その物足りなさを補うために、今回Rで簡単なデータ解析した結果を、rChartsでダイナミックに可視化してみたいと思います。 Rはオープンソースの統計解析向けのプログラミング言語であり、その開発実行環境でもあります。統計解析に特化した言語にはSAS、SPSSなど、有償のものが多い中、Rは無償で使うことができます。その結果として、Rは多くのユーザに支持されています。
最近、ビッグデータ、データサイエンティストという言葉を耳にする機会が増えてきました。そして、統計解析向けプログラミング言語である R にも注目が集まっています。R を使って、データ解析したいというニーズも増えてきています。今回、そのR で簡単なデータ解析した結果を、オープンソースパッケージのrCharts を使って可視化してみたいと思います。 統計解析向けプログラミング言語 R とは <img alt="Rlogo.png" src="http://tech-sketch.jp/Rlogo.png" width=181" height="137" class="mt-image-right" style="float: right; margin: 0 0 20px 20px;" /> R はオープンソースの統計解析向けのプログラミング言語であり、その開発実行環境でもあります。R が、他の
はじめに データ解析を行った場合,後からやり直しや結果参照,解析の詳細を確認するのって,案外だるいと思いませんか? 私は思います.結果を後から見直して,これってどうやってやってたんだっけとか,この部分変えたいとか,データ処理の細かい部分を確認したいとか,後日分析を引っ張りだして再確認することってよくあります.でもそのときに,詳細を忘れたり,ファイルが複数の箇所に分散しちゃってたり,なんてことがあって結局もう一度一からやり直すはめになったなんて悲しい経験はしたくないですよね. そんな折に,ちょっと前のTokyo.RでやってたそろそろRStudioの話をみて,これをもとに環境構築から,解析結果の管理までをトータルでやってみましょう,というお話です. 環境構築 生のRはぶっちゃけ使いにくいので,RStudioを使います.SPSSとかSASとかStataとかと比べても,割と遜色ない十分な出来の解析
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く