タグ

Rに関するkoemuのブックマーク (13)

  • データビジュアライゼーション・ツール20選 – lab.sugimototatsuo.com

    この記事はThe top 20 data visualisation toolsの原著者許諾済みの日語訳です。 By Brian Suda on September 17, 2012 Translated by Tatsuo Sugimoto 2014年4月28日更新:オリジナル記事が以前のサイトから移転したため発生していた画像の非表示に対応しました。 わたしがもっともよくきかれる質問のひとつが、データビジュアライゼーションを始める方法についてです。このブログの先へ進むには、練習し、さらに実践し、利用できるツールを理解する必要があります。この記事では、シンプルなチャートから複雑なグラフ、地図、インフォグラフィックスまで、ビジュアライゼーションを作成するための20種類のツールを紹介しようとおもいます。ほとんどのツールは無料で利用でき、そのうちいくつかはすでにインストール済みかもしれません。

    データビジュアライゼーション・ツール20選 – lab.sugimototatsuo.com
    koemu
    koemu 2013/09/02
    大学院で機械学習の講義を受けたときは、いきなりRとWekaだった。
  • 主成分分析が簡単にできるサイトを作った - ほくそ笑む

    あけましておめでとうございます。 年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *

    主成分分析が簡単にできるサイトを作った - ほくそ笑む
  • 統計データを誰でも使いやすくするR製Webアプリケーションフレームワーク·Shiny MOONGIFT

    ShinyはR製、GPL v3のオープンソース・ソフトウェアです。 統計情報を誰でも扱いやすくするためにWebブラウザ上で使えるようにしたいが、サーバサイドの言語を覚えるのが面倒なんて場合に使って欲しいWebアプリケーションフレームワークが登場しました。それがShinyです。なんとRだけでWebアプリケーションが作れてしまいます。 一例。右側がR、その結果が左側のグラフになります。画像での出力になります。 入力によって描画を変えられます。 複雑なグラフもRにとってはお手の物です。 こんな描画も。ぐわあ、動いて見える…。 分散図。 トレンドの直線を追加。 さらに男女分割。 もちろんShinyの使い方は通常のRとは異なりますので、覚えるべき部分はあるでしょう。基ui.Rとserver.Rになります。HTMLJavaScriptCSSを覚える必要なく統計表示用Webアプリケーションが作れ

    統計データを誰でも使いやすくするR製Webアプリケーションフレームワーク·Shiny MOONGIFT
  • plyr

    plyr is a set of tools for a common set of problems: you need to split up a big data structure into homogeneous pieces, apply a function to each piece and then combine all the results back together. For example, you might want to: fit the same model to subsets of a data frame quickly calculate summary statistics for each group perform group-wise transformations like scaling or standardising It’s a

    koemu
    koemu 2013/05/09
    データの前処理を便利に行ってくれるライブラリ群
  • データサイエンティストを目指すなら知っておきたいRパッケージ10個+α - データサイエンティスト上がりのDX参謀・起業家

    元ネタのブログは「10 R packages every data scientist should know about」と「10 R packages I wish I knew about earlier」です。紹介されているパッケージはどれも良いのでメモしておきます。私が「取得した方がいいだろうなー」と思う順番に並べ替えてます。サンプルコードは後者の記事に載ってます。 randomForest:超強力な汎用予測モデル RPostgreSQL, RMYSQL, RMongo, RODBC, RSQLite:各種データベースへの接続 plyr:データ集約 reshape2:データ加工 forecast:時系列予測 stringr:文字列操作 lubridate:日付操作 sqldf:SQLライクなデータ操作 ggplot2:綺麗なプロットを描く qcc:品質管理 個人的には、下の3つは

    データサイエンティストを目指すなら知っておきたいRパッケージ10個+α - データサイエンティスト上がりのDX参謀・起業家
  • 異常検知(変化点検出)のパッケージを作ってみた - yokkunsの日記

    時系列的な振る舞いの変化点を検出するためのパッケージを作ってみました。 CRAN: http://cran.r-project.org/web/packages/ChangeAnomalyDetection/ github: https://github.com/yokkuns/r-AnomalyDetection Usage changeAnomalyDetection(x, term = 30, smooth.n = 7, order = c(1, 0, 0), ...) x 時系列の数値ベクトル term 学習期間 smooth.n 移動平均の期間 order arima関数に渡すorder ... arima関数に渡すその他パラメータ 実行例 パッケージ読み込み library(ChangeAnomalyDetection) library(RFinanceYJ) library(

    異常検知(変化点検出)のパッケージを作ってみた - yokkunsの日記
  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • Installing GPU Packages | R Tutorial

    koemu
    koemu 2011/08/18
  • JIN'S PAGE

    R、R言語、R環境・・・・・・ Rのダウンロードとインストール リンク集 題名 Chap_01 データ解析・マイニングとR言語 Chap_02 Rでのデータの入出力 Chap_03 Rでのデータの編集と演算 Chap_04 Rと基統計量 Chap_05 Rでの関数オブジェクト Chap_06 Rでのデータの視覚化(1) Chap_07 Rでのデータの視覚化(2) Chap_08 Rでのデータの視覚化(3) Chap_09 GGobiとデータの視覚化(Rgobi) Chap_10 Rと確率分布 Chap_11 Rと推定 Chap_12 Rと検定 Chap_13 Rと分散分析 Chap_14 Rと回帰分析 Chap_15 Rと重回帰分析 Chap_16 Rと一般化線形モデル Chap_17 Rと非線形モデル Chap_18 Rと判別分析 Chap_19 Rと樹木モデル Chap_20 WEK

    koemu
    koemu 2011/08/03
  • Introduction to High-Performance Computing with Rを聞いてきた - yasuhisa's blog

    Rユーザー会の英語でのチュートリアル講演を聞いてきました。初立川でした。統数研が10月に立川に移転したということで、タクシーの運転手の人も警察官も「統数研」という言葉にぽかんとされてしまいました。12/5のほうに参加される方は時間にかなり余裕を持って行ったほうがよいと思います。 そんなわけで英語の発表を5時間くらい聞いていたので大分疲れましたが、とてもためになりました。個人的に知っていることが割りとあったのですが、知らないパッケージや関数とかも結構ありました。最後の"Extending memory limits using packages biglm, ff and bigmemory"は全然知らないところだったので、おーおー言いながら聞いておりました。 スライドの英語は読める&Rは分かるけど、英語はかなり聞き取れなかった(自分の能力的に)のでかなりやばいなーと。。。 会場に電源確保で

    Introduction to High-Performance Computing with Rを聞いてきた - yasuhisa's blog
    koemu
    koemu 2011/07/27
  • 統計解析用フリーソフト・R-Tips

    R は有名な統計言語『 S 言語』をオープンソースとして実装し直した統計解析ソフトです.さまざまなプラットフォーム(OS)に対応しており,誰でも自由にダウンロードすることができます.それにも関わらず,世界中の専門家が開発に携わっており,日々新しい手法・アルゴリズムが付け加えられています.とにかく計算が速い上にグラフィックも充実しているので数値計算などにも持ってこいです.このドキュメントは Windows 版 R と Mac OS X 版 R(と一部 Linux 版 R )でコマンドを調べた足跡です. ちなみに,この頁の内容を新しくした書籍は こちら ,電子書籍版は こちら で販売されております.

    koemu
    koemu 2011/07/26
  • R on Windows

    RはOSを問わず実行できる統計解析環境で、(自由に利用し、改変し、再配布することができる)フリーソフトウェアです。90年代後半から徐々に広がり、今では統計解析を行う環境として一般的なものの一つになっています。 このサイトでは、Windowsで、RおよびそのIDEであるRStudioを扱うための情報をまとめていきます。お気づきの点がございましたら、twitter(@takeshou)などでご指摘いただけますと助かります。 コンテンツ インストール関連 RとRStudioのダウンロード・インストールに関連する話題 RStudioの基的な使い方・設定 RStudioの基的な使い方の説明と設定について パッケージ関連 パッケージに関連する話題 R(RStudio)を使う(1) Rを使うために最低限必要な情報や理解しておくべき文法 R(RStudio)を使う(2) スクリプトファイルの書き方 R

    koemu
    koemu 2011/06/17
  • R GPGPU

    Enabling GPU Computing in the R Statistical Environment R is the most popular open source statistical environment in the biomedical research community. However, most of the popular R function implementations involve no parallelism and they can only be executed as separate instances on multicore or cluster hardware for large data-parallel analysis tasks. The arrival of modern graphics processing un

  • 1