タグ

Rに関するknekokzのブックマーク (10)

  • Rプログラム (TAKENAKA's Web Page)

    R でプログラミング:データの一括処理とグラフ描き 12. 見栄えのよいグラフ(その1):字をきれいに updated on 2009-03-27 R は細かい指定をしなくともいろいろ「適当」に作図してくれます. データをグラフにして自分で眺めるだけなら,見栄えを気にする必要はありません. デフォルトの設定で描いてくれるグラフでも十分です. けれども論文や学会発表で使う図となると,見た目をよくすることも必要です. 論文用や学会用の図を作れないのでは,R 入門のモチベーションが 下がってしまうことにもなります.また,せっかく作図を自動化しても,そのあと 他のソフトに読み込んで手作業で細工をするのでは効率がよくありません. この章では,とくに文字の表示・軸の設定を中心に, 特別のパッケージを使うことなく「外むけに使えるグラフ」を描く方法をまとめてみました. すべて,par ないしは作図関数中で

  • きれいなディレクトリ構成でRプログラミング

    Rでコーディングするときに、データや単体テストのコード、ライブラリなどのディレクトリ構成を決めておくと、なにかと便利です。毎度、ディレクトリ構成が変わると設定をコードに書かないとならなくなり、保守が面倒になりますよね。Convention over configuration です。 Rで推奨されるような綺麗なディレクトリ構成を自動生成するライブラリを発見しました (自分で作ろうと思ったのですが)。その名も ProjectTemplate です。 では、インストールします。 $ sudo R install.packages('ProjectTemplate') 使ってみます。 $ R library('ProjectTemplate') create.project('myproject') setwd('myproject') load.project() 以下のようなディレクトリ構成

  • Rで機械学習するならチューニングもグリッドサーチ関数orオプションでお手軽に - 渋谷駅前で働くデータサイエンティストのブログ

    ちょっと調べてみたらタイトルの件について言及してる記事があまり多くなかったので、ざっくり書いてみます。なお、この記事はid:shakezoさんの 実務でRandomForestを使ったときに聞かれたこと へのオマージュです。というか、実は僕もこの記事を読んでから「多分Rなら専用の関数なんかもあるだろうし簡単にできるはず」と思って以前よりも積極的にやるようになったのでした(笑)。 総論:何で機械学習するのにチューニングが必要なの? どんな機械学習でも、何かしらのチューニングパラメータを持っています。例えばソフトマージンSVMならマージンパラメータCがありますし、非線形ガウシアンカーネルSVMならさらにカーネルパラメータのσとかが入ります。SMO(逐次最大最適化)アルゴリズムを利用するのであれば、さらにさらにtoleranceとかも入ってきます。 しかも、ちょっといじってみればすぐ分かると思う

    Rで機械学習するならチューニングもグリッドサーチ関数orオプションでお手軽に - 渋谷駅前で働くデータサイエンティストのブログ
  • Rと集団学習

    集団学習(ensemble learning)は、決して精度が高くない複数の結果を統合・組み合わせることで精度を向上させる機械学習方法である。複数の結果の統合・組み合わせの方法としては、分類問題では多数決、数値の予測(回帰)問題では平均が多く用いられている。 集団学習では、異なる重み、あるいは異なるサンプルから単純なモデルを複数作成し、これらを何らかの方法で組み合わせることで、精度と汎化力を両立するモデルを構築する。 稿では、集団学習方法による、回帰・分類のアルゴリズムバギング(bagging)、ブースティング(boosting)、ランダム森(random forest)の基概念およびこれらのRのパッケージと関数を紹介する。 機械学習の問題では、学習によって回帰・分類を行うシステムを学習機械と呼ぶ。文献によっては学習機械を仮説(hypothesis)、分類器・識別器(classi

  • Random forests - classification description

    Random Forests Leo Breiman and Adele Cutler Random Forests(tm) is a trademark of Leo Breiman and Adele Cutler and is licensed exclusively to Salford Systems for the commercial release of the software. Our trademarks also include RF(tm), RandomForests(tm), RandomForest(tm) and Random Forest(tm). Contents Introduction Overview Features of random forests Remarks How Random Forests work The oob error

  • Random Forestで計算できる特徴量の重要度 - なにメモ

    (pixabay.comより) 1.背景とか Random Forest[1]とは、ランダムさがもつ利点を活用し、大量に作った決定木を効率よく学習させるという機械学習手法の一種です。SVMなどの既存の手法に比べて、特徴量の重要度が学習とともに計算できること、学習が早いこと、過学習が起きにくいこと(追記注釈1)などの利点が挙げられます。Kinectの姿勢推定に使われているらしいです。 最近、Random Forestをカジュアルに使う例が多く(特にうちの研究室)、一部パラメータやら出力やらがわからない人も多いと思います。使い方はTJOさんの資料[2]を読んでもらえれば理解できると思うし、詳細は波部先生の資料[3]をよんでもらえればわかると思います。 それで、いろいろな日語の資料をいくら読んでも、Random Forestがもつ特徴の1つである、特徴量の重要度の詳細に関してはほとんどノータッ

    Random Forestで計算できる特徴量の重要度 - なにメモ
  • 決定木 – 分類木 | トライフィールズ

    決定木とは、分類ルールを木構造で表したものである。分類したいデータを目的変数(従属変数)、分類するために用いるデータを説明変数(独立変数)という。目的変数がカテゴリデータなどの場合は「分類木」、連続値などの量的データの場合は「回帰木」と呼ばれる。 決定木の最大のメリットは、結果にグラフを用いることができるため、視覚的に確認できることである。 ここでは、R言語の「rpart」パッケージを用いて決定木について見ていこう。サンプルデータとして、Rに標準で含まれている「Titanic」を使わせていただいた。このサンプルデータはタイタニック号の乗客の属性情報と生死の情報が含まれている。生死を分けた要因を属性情報から分類するとどのようになるのかを見ていく。 まずは必要となるパッケージのインストールとロードを行う。「rpart」パッケージは決定木を行うためのものだが、「rpart.plot」と「part

  • R の apply 徹底解説 - あらびき日記

    この記事は abicky.net の R の apply 徹底解説 〜これで for 文も卒業!〜 に移行しました

    R の apply 徹底解説 - あらびき日記
    knekokz
    knekokz 2014/12/11
  • 平滑化スプラインと加法モデル | Logics of Blue

    最終更新:2017年03月11日 Rを用いた平滑化スプライン・加法モデルの簡単な解説と計算・予測方法を載せます。 単回帰・重回帰分析との比較を交えて説明します。 ここで用いたRコードは、まとめてこちらから見ることができます。 コードは2015年8月30日に動作確認をしました。動かないものがあれば、ご一報いただければ幸いです。 スポンサードリンク 目次 1.平滑化スプラインと加法モデル 2.平滑化スプラインの仕組み 3.グネグネ度(平滑化パラメータ)を推定する 4.Rによる平滑化スプライン 5.線形? それとも非線形? 6.グネグネ度の決め方 7.モデルチェック 8.薄板平滑化スプラインと平滑化スプラインANOVA 9.加法モデルによる予測 ~重回帰との比較~ 1.平滑化スプラインと加法モデル 平滑化とはなんでしょうか。正確な定義ではありませんが、ものすごく簡単に言うと、「散布図にニョロニョ

  • GoogleでのRコーディングスタイル

    前回の「GoogleとFacebookではRはどのように使われているか?」が意外と人気だったため、引き続き統計ソフトRのお話。 今回取り上げるのは、GoogleでのRコーディングスタイルについて。 これもちょっと調べ物をしていた際に発見したページです。 (もしかしたら、Rを利用されている方にとってはポピュラーなページかもしれませんが) 今回もこちらのページを日語訳に挑戦してみました。 (例によって英訳に誤訳等があるかもしれません…ご容赦ください) 今回のページはこちら。 GoogleCodeの中のページです。元々はGoogleCodeの中で、各種言語のコーディングスタイルが記載されているようです。 C++や、Objective-C、Pythonのスタイルが書いてありました。 Google's R Style Guide サマリー:Rスタイルルール1.ファイル名:「.R」で終わること 2.

    GoogleでのRコーディングスタイル
  • 1