タグ

Rに関するmfhamのブックマーク (52)

  • R-Source

    回帰分析を行なうために以下の関数が用意されている. lsfit() : 最小二乗法による回帰を行う. lm() : 線形モデルによる回帰を行う glm() : 一般線形モデルによる回帰を行う ここで対象となるモデルは以下のような線形モデルである. 上式をベクトル表記すると y = Xb + e となる.このときの y は応答ベクトル,X は説明変数のベクトル(モデル行列)で,x0 は切片項(要素が全て 1 である列ベクトル)となっている. 回帰分析と重回帰分析 関数 lm() により線形モデルの当てはめを行うことが出来る.この関数により,回帰分析や分散分析,そして共分散分析を行うことが出来る. 詳しい解説は『工学のためのデータサイエンス入門』(間瀬・神保・鎌倉・金藤 共著,数理工学社) を参照のこと.分散分析や非線形回帰についても詳しい解説が載っている. 関数 lm() の書式と引数 書式

    mfham
    mfham 2012/10/30
    サンプル.ドットの説明
  • 統計処理ソフト R 入門 講習会資料

    講習会の目的 講習会は, R についての自習の基盤をつくることを目指します。 たとえ初心者向けの数時間の入門講習でなく1年間の毎週の演習授業であっても,R に関してすべてを説明するのは不可能だと思われます。 R の世界は,縦にはそこそこ深く,横には果てが見えないほど広いです。 CRAN に登録されている R のパッケージは 1000 を超えました。 よって,受講者の幅も広いことですし,受講者各自にとってぴったりな統計解析の実用的な解説をするのはあきらめて, 各自が必要に応じて情報を探し,見つけたものを難なく活用できるようになること,を目標にしました。 ここに自分の求めている分析手法や作図法などの答えがあるとは期待しないで下さい。それは帰ってからのあなたの楽しい仕事です。 R の利用と R 言語 R の根幹は R 言語のインタプリタであり,ユーザはR言語を駆使することでRを操作します。 S

  • R-Bayes

    > p=seq(0,1,length=500) > a=10 > b=3 > s=21 > ns=26 > prior=dbeta(p,a,b) > like=dbeta(p,s,ns) > post=dbeta(p,a+s,b+ns) > Names<-c("prior","likelihood","posterior") > plot(p,like,ylim=range(post),type="l",main="prior,lilelihood,and posterior",xlab="x",ylab="Density",lty=2,lwd=1) > lines(p,prior,type="l",lty=1,lwd=1) > lines(p,post,type="l",lty=3,lwd=1) > legend(0,5,Names,col=1,lty=1:3) ナイーブベイズ(Naiv

    mfham
    mfham 2012/10/30
    サンプル.ベイズ
  • Rの基礎

    Abstract 稿では,統計解析を目的としたインタプリタ言語,およびその開発実行環境であるRの基礎的な使用法について述べる. Rは,統計解析を目的としたインタプリタ形式のプログラミング言語 R言語 のことであり,またその開発実行環境であるフリーソフトウェアのことである.ニュージーランドのオークランド大学統計学科のRoss Iahakaと,アメリカのハーバード大学生物統計学科のRobert Gentlemanにより1990年代半ばに開発された. R言語は,1980年代にAT&T研究所において開発されたS言語(S-PLUS)を参考としている.見かけ上はS言語との差違が少ないことからS言語のクローンと言われている.Rが開発されるまでは,このS言語やSAS,SPSSのパッケージがデータマイニング機能を備えた主なデータ処理・解析ソフトとして用いられてきたが,非常に高価であり,個人ユーザには入手し

    mfham
    mfham 2012/10/30
    サンプル
  • R-Source

    引数のチェックを行う 特定の引数に対して関数の手続きを変更したい場合は,if 文などの条件分岐で場合分けをすればよい.以下の関数 myprod() は引数 n が 0 の時に 1 を返す. myprod <- function(n) { if (n==0) 1 else prod(1:n) } myprod(0) [1] 1 myprod(5) [1] 120

    mfham
    mfham 2012/10/30
    サンプル
  • http://nlp.dse.ibaraki.ac.jp/~shinnou/zemi2010/dm/dm-tsaito-1214.pdf

    mfham
    mfham 2012/10/30
    サンプル
  • SVM のチューニングのしかた(1) - ほくそ笑む

    SVM のチューニング SVM(Support Vector Machine) はみなさん御存じ機械学習の手法です。 SVM はデフォルト設定でモデルを作ってもしょうがないです。gamma と cost というパラメータがあるので、これらの値に最適値を設定しなければなりません。R の SVM の Help にもこう書いてあります。 Parameters of SVM-models usually must be tuned to yield sensible results! (訳) SVM でいい結果出したかったらチューニングしろよな! というわけで、SVM のチューニングのしかたについて説明したいと思います。 交差検証 おっと、その前に、交差検証の話をしなければなりません。 SVM モデルをチューニングする際、二つのパラメータでグリッドサーチをします。 すなわち、パラメータをいろいろ変

    SVM のチューニングのしかた(1) - ほくそ笑む
    mfham
    mfham 2012/10/30
    サンプル
  • Blogger

    Google のウェブログ公開ツールを使って、テキスト、写真、動画を共有できます。

    mfham
    mfham 2012/10/30
    サンプル
  • R 言語定義 (R Language Definition) Version 1.1.0 (2000 June 15) DRAFT R Development Core Team

    mfham
    mfham 2012/10/30
    ドットの説明など詳細に書いてある
  • RMeCab - アールメカブ

    _ 基 2022 年 05 月 02 日 RMeCab_1.10 for R-4.2.0 (64bitUTF-8のみ対応) 公開 2022 年 04 月 29 日 RMeCab_1.08 for R-4.2.0 (64bitUTF-8のみ対応) 公開 2021 年 11 月 27 日 M1 MacOSX 用の注意を追記 2021 年 05 月 27 日 RMeCab_1.07 for R-4.1.0 (M1 Mac 用バイナリを追加で作成) 公開 2021 年 01 月 11 日 RMeCab_1.06 for R-4.0.3 (MacおよびLinuxでは辞書としてneologdを指定できるようになりました) 公開 R と MeCab? (ただしWindowsでは64bit UTF-8辞書版)の両方が既にインストールされているのならば R を起動し、コンソールで以下を実行すればRMe

    mfham
    mfham 2012/09/10
  • RでつくるWebアプリ~rApache編~

    3. サイバー系 自己紹介  和田 計也(@wdkz)  静岡県袋井市出身  サイバー系企業でデータマイニングエンジニア職  最近は大きなグラフの仕事してます  前職はバイオベンチャー  バイオマーカ探索してた  学生時代は枯草菌の研究 2012/5/26 2 4. サイバー系 初めに 夏野剛 R2.0 2004/10 DoCoMo2.0 2007/04 Tim O'Reilly Web2.0 2005 T Nakagawa, et al. RoKuRo2.0 John Schwartz 2012/05 BI2.0 2007/05 2012/5/26 3

    RでつくるWebアプリ~rApache編~
  • 第21回Tokyo.Rを開催しました - nifty engineer blog

    こんにちは、TokyoRスタッフの@doradora09です。 TokyoRでは月に1回のペースで土曜日にR言語の勉強会を実施しています。 今回は以下の内容で第21回の勉強会を開催しました。 発表内容 自己紹介タイム(30分) @aad34210: 続・はじめてのR (30分) @holidayworking: Rによるデータサイエンス第16章 集団学習 (30分) @Hiro_macchan: 観察データのバイアス調整 (30分) @horihorio: RでGARCHモデル (30分) @langstat: テキストマイニングで見る『機動戦士ガンダム』(30分) @yokkuns: Uplift Modelling (15分) LT @bob3bob3: RでPSM分析 (10分) atg: オタク的な標準偏差 (10分) @teramonagi: 菩薩でもわかる!R

    mfham
    mfham 2012/04/19
  • RでGARCHモデル - TokyoR #21

    2. 自己紹介 • Twitter ID: @horihorio • お仕事: データマイニング・コンサルタント (重要なこと:会社は非金融業) ただ何故か、金融機関の与信リスク管理・ 分析を、4年少々やってたりする • R使用歴: 半年もない、とか。前回発表(Tokyo.R#18: 「Rで学 ぶ 現代ポートフォリオ理論入門」 )以降、程度 2012/03/10 RでGARCHモデル 2 3. ◇ 全体構成 ◇ 1. Executive Summary 2. 理論編 1. ARIMAモデル 2. GARCHモデル 3. 実践編 1. TOPIXとは? 2. モデル作成 3. モデル検証 2012/03/10 RでGARCHモデル 3 4. 1. Executive Summary (1/5) 時系列モデルの目的:過去の値から将来を当てたい • ARIMAモデルの場合 AR I MA 誤差項

    RでGARCHモデル - TokyoR #21
  • データサイエンティスト上がりのDX参謀・起業家

    推定を作ってから約2ヶ月経ってからのコロナ陽性者数の推測結果、以下になりました。 第5波までの傾向だったらもう収束しているはずですが、収束しておらず、1日6,000〜7,000人くらいで停滞している感じです。これくらいの陽性者数が底になっている印象。恐らく、これからは今までと違う動きをすると思われるので、また違う推測モデルが必要かも。 2/6に、↓の記事で東京都のコロナ陽性者数に正規関数を当てはめて推移を予測しました。1ヶ月ほど経ったので、その予測の評価をしてみました。 iisssseeiiii.hatenablog.com 評価した結果は次の図のようになりました。 オレンジ線が実際の陽性者数で、青破線が2/6までのデータを使ったモデルで推測した値です。モデルを作ってから少し陽性者数が増加し、推測ではもっと増えると計算されてましたが、そこまで増えませんでした。ただ、その後の減り方は緩やかだ

    データサイエンティスト上がりのDX参謀・起業家
  • 多変量解析

    データの中には、多くのトレンド(傾向)が必ず隠れています。このトレンドをつかむことができるのならば優位に意思決定を進めることができます。 このページでは、データの中からトレンドを見つける多変量解析の手法を紹介します。 ことわざで「木を見て森を見ず(You can't see the forest wood for the trees. )」といわれるように、データマイニングの分野ではマクロ(巨視的)な視点で全体を捉える能力が求められます。 とはいえ、データの要素数が多くなると全体像を捕らえることが困難になるのです。 コンピュータは局所的な数値の集合として全体を把握していますので、意味ある情報として全体を見ることが不得意です。逆に人間には、もともと空間的に全体像を捉える能力が超越しています。 例をあげて解説します。 左図は写真です。写真も「画素」と呼ばれる一つ一つの情報の集まりで全

  • WindowsユーザーのためのR/Tinn-R|奥村泰之の情報公開

    はじめに このドキュメントでは,以下の2点をお伝えすることを目的として作成しています。 Rという無料の統計ソフト(データ解析環境)のインストール方法/初期設定の説明すること Tinn-Rという,Rとの連携を簡単にするための無料のエディタのインストール方法/初期設定/使い方の説明をすること 初めてR/Tinn-Rを導入する方は、以下の目次の順に、すべて読了して、設定を完了されることをお勧めいたします。なお,ドキュメントで出てくる内容は,Windows 7の環境で作成したものです。OSが,Windows以外の方は,ドキュメントは役立ちません。 What's New 法人Webサイトを開設しました。(2021/9/25) 臨床精神薬理に寄稿しました。(2021/2/4) 奥村泰之: 精神科におけるリアルワールド・データを活用したリアルワールド・エビデンスの創出:持続可能性のある研究体制構築に

  • RjpWiki - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですRjpWiki はオープンソースの統計解析システム 《R》 に関する情報交換を目的とした Wiki です † どなたでも自由にページを追加・編集できます. (初めて投稿・既存記事への追加・修正を行なう方はこのページ末の注意*1を御覧下さい) ページへのファイル添付については、画像ファイルのみパスワードなしで可能としてあります(ページ上部「画像添付」より)。その他のファイルの添付はパスワードを入力することで可能です(ページ上部「ファイル添付」より)。現在のパスワードは, Rでの round(qt(0.2,df=8),3) の実行結果です。 スパム書き込みに対処するため、書き込み系の処理に対してパスワードを設けました。ユーザ名の欄には,Rで round(qt(0.2,df=8),3) を実行

    mfham
    mfham 2011/04/18
  • Microsoft PowerPoint - Rによるデータマイニング.ppt

    Rによるデータマイニング 山義郎 東海大学理学部 yamamoto@sm.u-tokai.ac.jp 2006年度サマーセミナー 2 2006年8月5-8日 日の内容 � ????? � Rとは � Rによる解析の実践 コマンドと関数の利用 データの入力、インポート データの要約 � Rによるデータマイニング 多変量解析 データマイニングとは データマイニング手法 2006年度サマーセミナー 3 2006年8月5-8日 サマーセミナーとスプリングセミナー � サマーセミナー 大山(1993) 広島(1995?) 屋久島(1998) 支笏湖(1999) 嬬恋(2003) � スプリングセミナー 指宿(1997) 有馬温泉(1998) 河口湖 (1999) 因島 続きは明日の夜のセッションで 2006年度サマーセミナー 4 2006年8月5-8日 関数電卓としてRを使う � 算術演算子 +

    mfham
    mfham 2011/02/12
  • 「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11

    「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11Read less

    「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
    mfham
    mfham 2011/01/31
  • 高校数学の基本問題

    「あなたがまだやっていない問題」は、背景色・文字色の変化なし 「あなたが弱い問題」は、この色 「あなたが半分ぐらいできる問題」は、この色 「あなたがよくできる問題」は、この色