タグ

Rに関するMochimasaのブックマーク (9)

  • R で超簡単に並列処理を書けるパッケージ pforeach を作った - ほくそ笑む

    ※この記事は R Advent Calendar 2014 : ATND の 22 日目の記事です。 0. この記事の要約 R の foreach パッケージを改良して、デフォルトで並列計算するようにしたパッケージ pforeach を作りました。 pforeach - Easy to parallel processing in R これにより、R での並列計算を下記のようにシンプルに書くことができます。 library(pforeach) pforeach(i = 1:100)({ i ** 2 }) これは、従来の foreach で次のように書いたものと同じ動作をします。 library(foreach) library(doParallel) cl <- makeCluster(detectCores()) registerDoParallel(cl) foreach(i = 1

    R で超簡単に並列処理を書けるパッケージ pforeach を作った - ほくそ笑む
    Mochimasa
    Mochimasa 2015/12/22
    かなり便利だけど、CRANに登録されてない?
  • ggplot2 の自分用メモ集を作ろう - Triad sou.

    プロットの作製 基プロットを作る Geoms Aesthetics 違う種類のグラフを重ねる 参照線の追加 グループ分け 層別プロット スケールと軸 Scales 軸ラベルやタイトルの変更 軸の表示範囲を変更する 軸の左右の余白を削除する 軸表示の修飾 日時の軸スケール 軸区切り値の変更 軸スケールの変更 (変数変換) プロットのソート (離散型変数の水準をソートしてプロット) 座標系の反転:横向き箱ひげ図 極座標への変換:円グラフ 座標系のアスペクト比の指定 色セットの変更 ggplot2 のデフォルト色セットの定義 任意の色セットの利用 凡例 凡例位置の変更 凡例ラベルの変更 凡例の一部を削除する テーマ (グラフ背景・グリッドの色, マージン, フォント) Themes 定義済み theme の適用と編集 theme 要素と theme() の併用時の注意点 フォント変更 保存 g

    ggplot2 の自分用メモ集を作ろう - Triad sou.
  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

  • 統計処理ソフト R 入門 講習会資料

    講習会の目的 講習会は, R についての自習の基盤をつくることを目指します。 たとえ初心者向けの数時間の入門講習でなく1年間の毎週の演習授業であっても,R に関してすべてを説明するのは不可能だと思われます。 R の世界は,縦にはそこそこ深く,横には果てが見えないほど広いです。 CRAN に登録されている R のパッケージは 1000 を超えました。 よって,受講者の幅も広いことですし,受講者各自にとってぴったりな統計解析の実用的な解説をするのはあきらめて, 各自が必要に応じて情報を探し,見つけたものを難なく活用できるようになること,を目標にしました。 ここに自分の求めている分析手法や作図法などの答えがあるとは期待しないで下さい。それは帰ってからのあなたの楽しい仕事です。 R の利用と R 言語 R の根幹は R 言語のインタプリタであり,ユーザはR言語を駆使することでRを操作します。 S

    Mochimasa
    Mochimasa 2014/10/20
    言語仕様について整理されている、ありそうでなかった(私が知らなかった)資料。
  • ŷhat | Random Forest Regression and Classification in R and Python

    We've written about Random Forests a few of times before, so I'll skip the hot-talk for why it's a great learning method. But given how many different random forest packages and libraries are out there, we thought it'd be interesting to compare a few of them. Is there a "best" one? Or, is one better suited for your prediction task? Take a peek at the really great resources at the bottom or read ou

    ŷhat | Random Forest Regression and Classification in R and Python
  • 初心者用

    初心者用 R 言語講座 第 2 版 2013 年 3 月 12 日 文責:斎藤輪太郎・鈴木治夫 2 0. はじめに R 言語は統計処理を得意とする言語です。 多量のデータを科学技術計算を駆使して処理し、 そこに含まれる傾向を解析したり、可視化したりといったことが比較的簡単にできます。 テキストでは手っ取り早く R の簡単な使い方を勉強します。 1. R の起動と終了 システムによって異なりますが、通常はコマンドラインで R と入力するか、R のアイコ ンをダブルクリックして起動します。R を終了させるときは、 q() と入力します。 2. 簡単な変数への代入 変数とは様々な値を格納する箱のような概念です。例えば今 x という変数を考え、そこ に 123 を代入したければ、 x <- 123 とします。その後に x と打ち込むと、下記のように x の値が表示されます。 > x <- 123

  • 第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT

    今ほど統計解析が必要とされる時代はありません。オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しましょう! 読者にとってRは、世に溢れるデータの密林を切り開くための“ブッシュナイフ”となることでしょう(編集部) 統計解析の必要性とリテラシー 21世紀になって、経営学者の故ピーター・ドラッカー氏が言うところの知識労働者は、ますます統計解析を必要する局面が増えてきました。この状況は、20世紀後半から21世紀に起きた計算機能力の増大とインターネットの発展を基礎に、3つの大きな潮流が現れたことがキッカケとなっているように思います。その3つの潮流とは、オープンソース、オープンデータ、そしてオープンアイデアです。後ろの2つは今筆者が名付けました。 オープンソースは、皆さんがご存知のように、Linux、Apache、PerlPythonRubyなどのO

    第1回 Rは統計解析のブッシュナイフだ - 実践! Rで学ぶ統計解析の基礎 - @IT
  • R 入門

    Rとは? R は統計計算とグラフィックスのためのフリーソフト(GNU-style copyleft)である。 Rは商用ソフトのS(AT&T ベル研究所のRichard A. Becker, John M. Chambers, and Allan R. Wilks により作られた統計解析やグラフィックスのための言語であり、製品としては S version 4 や S-Plusがある)に操作環境などが良く似ており、Sを使っている場合には関数の利用法がほぼ同じことから取っつきやすく、Sで定義した関数などはRでもほとんど変更なしに動作する。 Sの現在のバージョンほどは新たな手法やグラフ表示法は取り入れられていないが、通常の解析ならば不都合は感じないだろう。 CRAN(The Comprehensive R Archive Network)にはRに対する追加パッケージも沢山あり、新たな手法は、これら

  • グラフィックス参考実例集:棒グラフ - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですグラフィックス参考実例集:棒グラフ、ヒストグラムを描く barplot, hist (グラフィックス参考実例集に戻る。Rのグラフィックスパラメータを参照する。) 単純な棒グラフ † barplot 関数は棒グラフを描きます。棒グラフは、棒の長さにより観測値の大きさや度数を表すものです。数値ベクトルを引数として与えるのが、関数barplotもっとも簡単な使い方です。こうするとベクトルのそれぞれの値が棒の高さになります。 引数が行列ならば各列が一の棒となり、列の各要素の値により棒をブロックに分けます。 引数angle、density、colはそれぞれ棒を塗り分ける線分の角度、塗り分ける際の線分の数、塗り分けの色を指定します。colだけを与えればブロックごとに塗りつぶします。 引数legen

  • 1