タグ

Rに関するyahihiのブックマーク (35)

  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ

    yahihi
    yahihi 2012/08/26
  • 一年で身に付ける!Rと統計学・機械学習の4ステップ - データサイエンティスト上がりのDX参謀・起業家

    久しぶりの投稿です。この一年間、Rの勉強会などに参加したり主催したりしてきて、後輩や勉強会の方々の話をいろいろ聞くとこができました。そんな中、一年間でRと統計学・機械学習を身に付けれるようなフローを作れるかも?と思ったので、ここで記録しておきます。統計学や機械学習は理論を勉強するだけでなく、Rで実際に解析してみることで、より理解が深まります。 ステップ1. 分布・検定 理論 統計学入門 (基礎統計学?) 作者: 東京大学教養学部統計学教室出版社/メーカー: 東京大学出版会発売日: 1991/07/09メディア: 単行購入: 158人 クリック: 3,604回この商品を含むブログ (79件) を見る R Rによるやさしい統計学 作者: 山田剛史,杉澤武俊,村井潤一郎出版社/メーカー: オーム社発売日: 2008/01/25メディア: 単行購入: 64人 クリック: 782回この商品を含

    一年で身に付ける!Rと統計学・機械学習の4ステップ - データサイエンティスト上がりのDX参謀・起業家
    yahihi
    yahihi 2012/03/31
  • LET2011: Rによる教育データ分析入門

    教育データマイニングによる英語学習の実態把握Yuichiro Kobayashi470 views•72 slides

    LET2011: Rによる教育データ分析入門
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
    yahihi
    yahihi 2012/02/14
    あやめのデータはRの本にも出てきました
  • LionでR

    (ふと、昭和軽薄体を思い出したのだが気にせず流す) Rの現行安定バージョンは、2.13.1(2011年7月8日リリース)だ。ちょうどLionが出る少し前である。ソースからビルドしている人はどうなのかわからないが、Lionユーザは公式のpkgではなく、http://r.research.att.com/ からバイナリをダウンロードせよという指示があった。行ってみると「Patched」な2.13.1のuniversal binaryが置いてある。pkgでも、tar.gzでも結果は同じようだ。 さらに、同じページの下にある「Mac OS X GUI」の「R-GUI-5895-2.13-leopard-Leopard64.dmg」を落としてApplicationsに入れてやる。これでひとまずGUIでRが使えるようになる。 作業ディレクトリがホームなので、適当に文書の下にRなどというフォルダを作って

    yahihi
    yahihi 2012/02/14
  • 統計解析のための専用言語R(R言語)とは - builder by ZDNet Japan

    「R(またはR言語とも呼ぶ)」は、オープンソースの統計解析向けのプログラミング言語とその開発実行環境である。現在はR Development Core Teamによって開発およびメンテナンスが進められており、GPLにもとづいて無料で利用することができる。LinuxやFreeBSDをはじめとするUNIX系OSやMac OS、Windowsなど、複数のOSでの開発・実行に対応している。 Rは利用目的を統計解析に特化した言語であり、データを効率的に操作・保管するための仕組みや、配列や行列の演算をサポートした演算子のセット、結果を可視化するためのグラフ作成機能などを備えている。プログラミング言語としては条件分岐やループ処理、ユーザー定義の再帰的関数、テキスト形式のデータ入出力などといった基的な機能を備えているほか、オブジェクト指向の手法も取り入れている。 最大の強みは、多くの標準的な統計手法を標

    統計解析のための専用言語R(R言語)とは - builder by ZDNet Japan
  • 第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT

    今ほど統計解析が必要とされる時代はありません。オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しましょう! 読者にとってRは、世に溢れるデータの密林を切り開くための“ブッシュナイフ”となることでしょう(編集部) 統計解析の必要性とリテラシー 21世紀になって、経営学者の故ピーター・ドラッカー氏が言うところの知識労働者は、ますます統計解析を必要する局面が増えてきました。この状況は、20世紀後半から21世紀に起きた計算機能力の増大とインターネットの発展を基礎に、3つの大きな潮流が現れたことがキッカケとなっているように思います。その3つの潮流とは、オープンソース、オープンデータ、そしてオープンアイデアです。後ろの2つは今筆者が名付けました。 オープンソースは、皆さんがご存知のように、Linux、Apache、PerlPythonRubyなどのO

    第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT
  • Rでお絵かき その2 グラフをファイル保存 - ウィリアムのいたずらの、まちあるき、たべあるき

    delta<- 1000 en.x<-seq(0,pi,length=delta) en.y<-sin(seq(0,pi,length=delta)) plot(en.x,en.y,type="l",xlim=c(0,pi),ylim=c(0,1))

    Rでお絵かき その2 グラフをファイル保存 - ウィリアムのいたずらの、まちあるき、たべあるき
    yahihi
    yahihi 2012/02/09
  • Rが使えるフリをするための14の知識

    米国FDAで公認され、ハーバード大学やイェール大学の授業で利用されるようになり、世間での認知度が着実に上昇している統計用プログラミング環境のRだが、ユーザーなのか、ユーザーになりたいのか、ユーザーとして振舞いたいのか分からない人が増えてきた。 スノッブなユーザーとして振舞う場合は、Rの特性を語れる必要があるので、ユーザーになるよりもRへの知識や理解が必要で、実は難易度が高い行動である。それでもあえて意識の高いRユーザーとして振舞いたい人々のために、最低限求められる事のチェック・リストを用意してみた。 1. 参考文献や参考ページを押さえておく 一番大事な事だが、参考文献や参考ページを押さえておこう。公式サイトで配布されている、「R 入門」「R 言語定義」「R のデータ取り込み/出力」は持っておくべきだ。R-TipsやRjpWikiも参考になる。 2. 演算子や制御構文をマスターする 四則演算

    Rが使えるフリをするための14の知識
  • Java R Interface (JRI) を用い 統計解析環境 R を Java から使用する - hamadakoichi blog

    統計解析・データマイニング環境の R を Java から使用する方法を以下に紹介する。 現在、RをJavaで使用する方法に関する文献は非常に少ないが参考サイトをまとめたものも下部に記述する。 rJava というPackageに含まれている Java R Interface (JRI) を用い R をJavaから呼び出すことができる。 ※rJava: Download: http://www.rforge.net/rJava/files/ SVN: svn://svn.rforge.net/rJava/ ※以下、Eclipse 3.4.2の環境を例に説明する。 ※また、Eclipseで R言語環境自体を使う方法はR を Eclipse で使うを参照。 統計解析環境 R のインストール・環境設定: 統計解析環境 R 自体のインストール・環境設定はR のインストール・環境設定を参照。 rJava

    Java R Interface (JRI) を用い 統計解析環境 R を Java から使用する - hamadakoichi blog
    yahihi
    yahihi 2012/02/03
  • 統計処理ソフトウェアRをEclipseでJavaから使う - 明日とロボット

    Rとは 統計用途に特化されたオープンソースのプログラミング言語。 数多くの統計パッケージが無償で公開されている 欠点は、GUIが乏しかったり、大きすぎるデータ処理は難しい点 ダウンロード・インストール こちらより最新版をダウンロード 32bit/64bitは後に選択できる。 以下のように下の方にインストールしとくと後々便利 C:\R\ Javaから使うために rJavaというパッケージをRにインストールする。 install.packages('rJava') ダウンロード元を聞かれるので、適当に一つ選ぶ。(日ならtsukubaとか) 環境変数の設定 マイコンピュータを右クリックし、properties advanced system settingsをクリックし、advancedタブ下にあるEnviroment variablesをクリック 以下を参考に環境変数を設定 R_HOME:

    統計処理ソフトウェアRをEclipseでJavaから使う - 明日とロボット
    yahihi
    yahihi 2012/02/03
  • NotePad++とNppToRとR用自動補完API - はやしのブログ Rev.3

    R用エディタとしてはESS on Emacsが最強なのは間違いないですが,初心者にはとっつきづらいです。社会学界隈では大半の人が,エディタって何?おいしいの?ってレベルなので,とてもじゃないですがおすすめできません。 かといってWindowsのRはGUIがしょぼすぎる。というか実用レベルじゃない。プロンプトでshift+矢印で選択できないとかどういうこと?一向に改善されないのは開発者がみんなESS使ってるからなんでしょうか。 そこで外部エディタと連携させようというのが次善の策になるわけですが,おすすめしたいのがNotePad++とNppToRの組み合わせです。NotePad++はプログラマ用エディタで,そこそこ人気らしいです。色付けやら自動補完やらいろいろ便利な機能が付いています。そしてNppToRは,NotePad++とRを連携させてくれるありがたいソフトウェアです。Rのデフォルトのエデ

    NotePad++とNppToRとR用自動補完API - はやしのブログ Rev.3
    yahihi
    yahihi 2012/01/17
  • Rクックブック

    オープンソースの統計解析ツール、Rの使い方、機能、威力を、200以上におよぶ問題の「レシピ」を通じて紹介するクックブックです。Rを使う上で頻繁に遭遇する問題、役に立つヒントを厳選した、実用的、実際的なテクニック集となっています。Rの基操作から、高度なテクニックまで網羅。初心者にとってはつまずきやすいポイントや間違いやすい箇所を的確にフォロー。中級者以上にとってはRを使った作業がより生産的、効率的になるような「使える」レシピを用意しています。 関連ファイル 付録A-C(チュートリアル) 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すでに修正が施されている場合がありますので、書籍最終ページの奥付でお手持ちの書籍の刷版、刷り年月日をご確認の上、ご利用ください

    Rクックブック
  • [統計] Google Analytics For The R 導入方法(途中) – FXFROG

    投稿者 斉藤之雄 (Yukio Saito) 2010年12月15日 #1.1, #10, #11, #1908, #1932, #2.12, #2.6, #2010, #3.4, #32, #64, #Analytics, #API, #Auto, #be, #bit, #bitops, #building, #Can, #code, #com, #Date, #Desktop, #documents, #done, #downloaded, #Draft, #Files, #for, #From, #fxfrog, #Google, #googlecode, #gt, #gz, #Handler, #HELP, #http, #if, #importing, #indices, #information, #inst, #install, #installed, #Installing

    [統計] Google Analytics For The R 導入方法(途中) – FXFROG
  • R を Eclipse で使う - hamadakoichi blog

    Open Source の統計解析・データマイニング環境である R。 R を Eclipse で使用するための環境構築法、使用方法を以下に紹介する。 参考:A guide to Eclipse and the R plug-in StatET (Longhow Lam, PDF) ※ここでは、R 2.10.1, Eclipse 3.4.2 を例に挙げる。 R, Eclipse のインストール 1.R のインストール・環境設定: R のインストール・環境設定 2.Eclipseのインストール: Eclipse.org: http://www.eclipse.org/ Pleiades (All in One Eclipse) :http://mergedoc.sourceforge.jp/ Eclipse にR plug-inのインストール 1. Eclipseを起動。 2. Help ->

    R を Eclipse で使う - hamadakoichi blog
  • 統計ソフト R の内容に特化したサーチエンジン seekR を作った

    seekR – 統計ソフトウェア R のための検索エンジン 統計ソフトウェア R のための検索エンジン。R 関係の内容のページに偏った検索結果を表示します。 作ったとは言っても、Google Custom Search で出てきたコードを貼り付けただけなので、HTML を除けばコードは 1 行どころか 1 文字も書いていません。 前もって知っている関数やパッケージの使い方は、help(関数名) とか、?関数名 で検索できるけど、初めて使う機能は関数の名称やそもそも機能が存在するのどうかも調べようがなく、長い間困っていました。 さらに残念なことに、R は名前が 1 文字 「R」 なので SEO 能力が非常に弱く、もはや検索という試合の開始前にして既に負けているようなものです。例えば、「PHP 配列 結合」や「JavaScript 配列 結合」では取得したい情報のページが表示されますが、「R

  • Google、R言語に64 ビットint導入

    R is a language and environment for statistical computing and graphics. Googleは11月24日(米国時間)、「Rプログラミング言語」に「64ビット整数ベクタ」を実現するパッケージが登場したことを発表した。これはGoogleがRomain Francois氏のスポンサーシップを実施する形で実現した機能拡張とされている。 Rは統計計算や統計データのグラフィック化などを実施するためのプログラミング言語および統計処理環境。ベル研究所で開発された「S」のオープンソース版実装に相当するもので、現在でも盛んに開発されており、多くの統計方法を実装し、高度で美しいグラフィックレンダリングを実施することで知られている。統計処理においてはよく活用されているソフトウェアのひとつ。 Rはこれまで64ビットの整数をサポートしてこなかった。今回

  • GoogleとFacebookではRをどうやって使っているのか?

    ひさしぶりに統計ソフトRの話。 来年こそは仕事でバリバリつかってみようと思っている統計ソフトのR。 前のエントリーでも書いているように、フリーソフトなのに高機能。(統計解析・グラフの種類が豊富) しかし、日語での資料がまだ少ないのがちょっとイタイ…。 (最近は書籍でも多く診られるようになってきましたけどね!嬉しい限りです) ちょうど調べ物をしてたときに、「How Google and Facebook are using R」というエントリーを見つけました。 今日はその内容をちょっと日語に訳した内容を紹介しようと思います。 紹介するサイトこの記事が書かれていたのは、Dataspora Blog というサイトで、データに関する(Big Data, open source analytics, and data visualization)記事をメインに書かれているようです。 (私は知らな

  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む
    yahihi
    yahihi 2012/01/06
  • R meets MongoDB - 元データ分析の会社で働いていた人の四方山話

    最近、割と大きめなデータをRで扱う際に、どのようなソリューションがいいか色々と考えています。 ここでのソリューションは並列計算云々という観点ではなく、大きめのデータから必要なデータをさっくりと用意して、解析フェーズに簡単に入っていくために、という観点です。 1つは有名すぎるbigmemoryというソリューションがあって、これは今後浸透していくんだろうなぁとは思いつつ、bigmemoryではデータ型がbig.matrixという特殊なものになってしまうので、既存のMatrixやdata.frameを使ったパッケージの関数が使えなくなってしまう*1という点が微妙だなぁと思っています。 そんな時に、Twitterのtimellineを眺めていたら、MongoDBのR driverができたとかいうtweetを見かけました。 MongoDBはかなり柔軟に色々できますし、何より今アツいトピックの1つです

    R meets MongoDB - 元データ分析の会社で働いていた人の四方山話
    yahihi
    yahihi 2011/12/26