タグ

統計学とRに関するfukudamasa09のブックマーク (19)

  • TokyoRの第36回R勉強会に行ってきました - Java Coffee Cafe

    珍しく勉強会参加報告。 これ -> http://atnd.org/events/47713 統計解析に特化した言語なので発表内容もその方面に偏るわけだが、 とは言ってもいろんなドメインがあって、手法もそのぶんいろいろあるので よく聞く話から今まで全く知らなかったことまでいろいろ聞けて面白いものだ あと、難しい話はしないので詳しく知りたい方はslideshareを見てください というわけで内容まとめるよ 10分で分かるR言語入門 ver2.6 10分で分かるr言語入門ver2 6 from Nobuaki Oshiro Rの文法やCRAN、お役立ちサイトなどの紹介 タイトルから分かるようにこれからRを始める人に向けた内容だった 10分しか話してない(実際の発表時間は計ってませんw)ので導入といった感じ Rによるやさしい統計学 「第20章 検定力分析によるサンプルサイズの決定」 Rによるやさ

    TokyoRの第36回R勉強会に行ってきました - Java Coffee Cafe
  • 「統計モデリングとは何なのか」をいま一度整理してみる - 渋谷駅前で働くデータサイエンティストのブログ

    もうタイトルを読んで字の如しなんですが、要は「統計モデリングってぶっちゃけ何なのよ?」という問題意識が最近非常に局所的ながら影響力の大きいところ*1から出てきておりまして。 で、僕もその議論にマターリ参加しながら「このもやもやしたものをどうやったらうまく表現できるかなー」と思っていて、何日かして自分なりにちょっと整理がついた気がするので、自分向けの備忘録も兼ねてちょっとブログにまとめてみることにしました。ちなみに@berobero11さんは既にこの議論についてまとめていらっしゃるようで。 あてはめの原理・あてはめを実装する計算法・モデル そうそう、今回もお題はこちらの久保先生の緑です。というかここから議論が始まったわけで。 データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学) 作者: 久保拓弥出版社/メーカー: 岩波書店発売日: 20

    「統計モデリングとは何なのか」をいま一度整理してみる - 渋谷駅前で働くデータサイエンティストのブログ
  • 単純な集計とデータサイエンスによる分析とで結果が食い違うかもしれない3ケース - 渋谷駅前で働くデータサイエンティストのブログ

    一般に、データ分析の大半はそれほど高度なテクニックの類を必要としないものです。僕も常日頃から口に出して言うことが多いんですが、「統計学だの機械学習だのの出番なんてそもそも少なくて当たり前」。工数もかかるし、できればやらない方が良いです。ぶっちゃけ単純な四則演算で十分なケースの方が多数派でしょう。 なので、普段はDB上でSQL(というかHiveなど)でサクッと四則演算だけで集計処理を済ませてしまって、その結果だけを表示するようにしておいた方が圧倒的に楽で手っ取り早いはず。多くのBIツールもそういう考えのもとで作られていると思います。 ところがどっこい。世の中には、単純な四則演算での集計結果と、データサイエンスを駆使した分析結果とで、い違ってしまうケースが何故かあることが知られています。どちらかと言うとレアケースだとは思いますが、その矛盾をおざなりにするととんでもないことになることも多々あり

    単純な集計とデータサイエンスによる分析とで結果が食い違うかもしれない3ケース - 渋谷駅前で働くデータサイエンティストのブログ
  • JIN'S PAGE

    R、R言語、R環境・・・・・・ Rのダウンロードとインストール リンク集 題名 Chap_01 データ解析・マイニングとR言語 Chap_02 Rでのデータの入出力 Chap_03 Rでのデータの編集と演算 Chap_04 Rと基統計量 Chap_05 Rでの関数オブジェクト Chap_06 Rでのデータの視覚化(1) Chap_07 Rでのデータの視覚化(2) Chap_08 Rでのデータの視覚化(3) Chap_09 GGobiとデータの視覚化(Rgobi) Chap_10 Rと確率分布 Chap_11 Rと推定 Chap_12 Rと検定 Chap_13 Rと分散分析 Chap_14 Rと回帰分析 Chap_15 Rと重回帰分析 Chap_16 Rと一般化線形モデル Chap_17 Rと非線形モデル Chap_18 Rと判別分析 Chap_19 Rと樹木モデル Chap_20 WEK

  • 認証がかかっています

    こちらのブログには認証がかかっています。 ユーザー名 パスワード Powered by Seesaa

  • 続・わしの頁

    「R で学ぶデータマイニング�T,�U」「R Commander ハンドブック」の再版作業が大方終了したので, 今月は別の 2 冊の執筆作業を進め,来月からはいよいよ「The R Tips」の再版(改訂)作業を開始する予定. 他の 1 冊も来年春までに執筆完了しなければいけないので,当分は暇にならないなぁ・・・. 作業の息抜きに テトリス・最高難度プレイ. 見入ってしまいます・・・. 作業に疲れたら ああエキセントリック少年ボウイ. 名曲です^^.(08.10.05) - R に関する資料・統数研の公開講座「 R で学ぶデータ解析とシミュレーション」1 日目の資料 - 【 R 入門】 R 2.6.2 のセットアップ : Windows 版 R で R 入門. 【 R 入門】 第 1 回 : R の基礎知識. 【 R 入門】 第 2 回 : R でグラフ作成. 【 R 入門】 第 3 回

  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

  • Rの基本パッケージ中の回帰、分散分析関数一覧 - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですR の回帰分析と分散分析関数の簡易一覧 Rは回帰分析関連の関数を多数持ち、統計解析機能の中心的位置を占める。 以下では、線形(重)回帰モデル、一般化線形モデル、非線型回帰モデル、そしていくつかの 現代的手法用の関数を紹介する。現代的な統計理論では、分散分析も線形回帰モデルとして処理することが 普通であるため、分散分析関連の関数もここで一緒に紹介するのが適当である。 線形モデルを当てはめる lm() 関数 lm() は線形モデルの当てはめに使われる。回帰分析、および一元配置 分散・共分散分析を行える(後者に付いては aov() 関数の方がより広範囲なインタフェイスを与える)。 lm(formula, data, subset, weights, na.action, method = "qr"

  • R言語で統計解析入門: 目次1 テクニカルデータプレゼンテーション  梶山 喜一郎

    Technical Data presentation in R コピペで学ぶ Rでテクニカルデータプレゼンテーション 1.基礎統計解析編 グラフィックス・リテラシ-教育: 「図学 I ・図形情報 I ・統計学」科目 修了後のコースウェア 福岡大学工学部図学教室   梶山 喜一郎 ・つまみいで,学習しないように願います. ・データの可視化を体系・系統だったスキルにするために順を追って学習する. ・統計ブームに乗っている学習者も先人に感謝の気持ちを.さらに, ・確かなスキルにするために,教科書・解説書を理解し,Rスクリプトで確認. A. はじめに--ここは統計・解析の必要を味わった後で読めばよい まず,統計の手続きを実行する.慣れたら統計的に考えよう. 学校の統計学を復習--買った教科書とノートをまた読むだけ a. 測定と尺度 Measurement and scale b. 記述統計学の

  • Rが使えるフリをするための14の知識

    米国FDAで公認され、ハーバード大学やイェール大学の授業で利用されるようになり、世間での認知度が着実に上昇している統計用プログラミング環境のRだが、ユーザーなのか、ユーザーになりたいのか、ユーザーとして振舞いたいのか分からない人が増えてきた。 スノッブなユーザーとして振舞う場合は、Rの特性を語れる必要があるので、ユーザーになるよりもRへの知識や理解が必要で、実は難易度が高い行動である。それでもあえて意識の高いRユーザーとして振舞いたい人々のために、最低限求められる事のチェック・リストを用意してみた。 1. 参考文献や参考ページを押さえておく 一番大事な事だが、参考文献や参考ページを押さえておこう。公式サイトで配布されている、「R 入門」「R 言語定義」「R のデータ取り込み/出力」は持っておくべきだ。R-TipsやRjpWikiも参考になる。 2. 演算子や制御構文をマスターする 四則演算

    Rが使えるフリをするための14の知識
  • Excel上でRを動かすRExcel - もうカツ丼でいいよな

    最近Office Professionalを買ったので,近頃はもっぱらOfficeで遊んでいる.Officeはちょっとバグとか多くて難しいから,よく勉強をして早く初心者を脱出したい. で,ここ2〜3日はExcelからRを呼ぶ方法をいろいろ調べていた.やっぱVBAちょっとくらい勉強しないと駄目かなとか思い始めた頃,RExcelというExcelのアドインを見つけた(statconn).これを使うと結構実用的なレベルでExcelとRを連携させられそう*1. RExcelのインストール まず,rscproxyとrcomの2つのパッケージをRから入れておく.下の二行はRExcelのインストール時にやれっていわれたからやった*2. install.packages("rscproxy") install.packages("rcom") library(rcom) comRegisterRegistr

    Excel上でRを動かすRExcel - もうカツ丼でいいよな
  • 青木繁信氏:おしゃべりな部屋 (統計学ほか)

    アクセスしていただき,ありがとうございます。 このページへのアクセスは,通算 6265344 回目です。 (1995年8月31日 からカウント開始) フォト蔵ふ つれづれなるままに ときどき一枚 狛犬ギャラリー 道祖神ギャラリー

    青木繁信氏:おしゃべりな部屋 (統計学ほか)
  • 10行でナイーブベイズ 〜Rって便利だね!〜 - あらびき日記

    この記事は abicky.net の 10行でナイーブベイズ 〜Rって便利だね!〜 に移行しました

    10行でナイーブベイズ 〜Rって便利だね!〜 - あらびき日記
  • R-Source

    データフレームとは データフレームとは data.frame クラスを持つリストのことであり,数値ベクトルや文字ベクトル,因子ベクトル(文字型ベクトル)などの異なる型のデータをまとめて1 つの変数として持っている.外見は行列と同じ 2 次元配列であるが,データフレームの各行・列はラベルを必ず持ち,ラベルによる操作が可能である点が普通の行列と異なる.しかも各列の要素の型はバラバラでも構わないので,ベクトルやリストで持っているデータをデータフレームに変換することで統計解析がやりやすくなる. 数値ベクトルと因子はそのままの状態で含まれ,非数値ベクトルは因子に強制変換される.データフレームに変数として現れるベクトル構造は全て同じ「長さ」を,行列構造は同じ「行サイズ」を持たなければならない. データフレームの作成例 データフレームを作成する方法は以下のような方法がある. ベクトル(や行列,リストなど

  • 一元配置分散分析

    $F_0 = 4.6146$ となる。 検定統計量 $F_0$ は,第 $1$ 自由度が $df_{b}( = k - 1 )$,第 $2$ 自由度が $df_{w}( = n - k)$の $F$ 分布に従う。 例題の場合,自由度は $df_{b}= 2$,$df_{w} = 9$ である。 第 $1$ 自由度が $df_{b}$,第 $2$ 自由度が $df_{w}$ の $F$ 分布において,有意確率を $P = \Pr\{F \geqq F_0\}$ とする。 $F$ 分布表($\alpha = 0.05$,$\alpha = 0.025$,$\alpha = 0.01$,$\alpha = 0.005$),または $F$ 分布の上側確率の計算を参照すること。 例題では,自由度が $(2, 9)$ の $F$ 分布において,$\Pr\{F \geqq 4.26\}= 0.05$ で

  • 東京工業大学 情報理工学院 数理・計算科学系

    大岡山地区の建物 大学正門より,桜並木のウッドデッキを通り,右手の芝生をつっきる小径が西8号館,西7号館に続くみちです. 大岡山西8号館(E棟,W棟): キャンパスマップの18, 19番の建物にあたります.館の西隣りに位置しています.正面玄関をはいったところは3階です. E棟においでの方は廊下をはいってすぐ左手のエレベータをご利用下さい. W棟にはじめておいでの方は十分に注意して下さい.E棟とW棟を繋いでいる通路は3階と10階にしかありません.E棟のエレベータを利用すると迷子になります.正面玄関から廊下をまっすぐにおいでになり,奥の右手にあるエレベータをご利用下さい. 西7号館:キャンパスマップの17番の建物にあたります.西8号館から,建物を二つ挟んだ並びにあります.芝生から向う場合,左手に館を見ながら進み,館がとぎれたあたりの右手にある小さな建物が西7号館です.橋を渡ってはいったと

  • R on Windows

    RはOSを問わず実行できる統計解析環境で、(自由に利用し、改変し、再配布することができる)フリーソフトウェアです。90年代後半から徐々に広がり、今では統計解析を行う環境として一般的なものの一つになっています。 このサイトでは、Windowsで、RおよびそのIDEであるRStudioを扱うための情報をまとめていきます。お気づきの点がございましたら、twitter(@takeshou)などでご指摘いただけますと助かります。 コンテンツ インストール関連 RとRStudioのダウンロード・インストールに関連する話題 RStudioの基的な使い方・設定 RStudioの基的な使い方の説明と設定について パッケージ関連 パッケージに関連する話題 R(RStudio)を使う(1) Rを使うために最低限必要な情報や理解しておくべき文法 R(RStudio)を使う(2) スクリプトファイルの書き方 R

  • RjpWiki - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですRjpWiki はオープンソースの統計解析システム 《R》 に関する情報交換を目的とした Wiki です † どなたでも自由にページを追加・編集できます. (初めて投稿・既存記事への追加・修正を行なう方はこのページ末の注意*1を御覧下さい) ページへのファイル添付については、画像ファイルのみパスワードなしで可能としてあります(ページ上部「画像添付」より)。その他のファイルの添付はパスワードを入力することで可能です(ページ上部「ファイル添付」より)。現在のパスワードは, Rでの round(qt(0.2,df=8),3) の実行結果です。 スパム書き込みに対処するため、書き込み系の処理に対してパスワードを設けました。ユーザ名の欄には,Rで round(qt(0.2,df=8),3) を実行

  • R による統計処理

    「Rによる統計解析」 オーム社 刊 サポートページ 目次 第1章 Rを使ってみる 第2章 データの取り扱い方 第3章 一変量統計 第4章 二変量統計 第5章 検定と推定 第6章 多変量解析 第7章 統合化された関数を利用する 第8章 データ分析の例 付録A Rの解説 付録B Rの参考図書など はじめに R とは何か,何ができるかのリンク集(日のもののみ) R を使うためにはどうしたらいいの? データなどの読み書き R の定石(R に限らずプログラミングの定石も) R を使って実際に統計解析をする AtoZ 一連の流れ データファイルの準備をする 分析してみる 分析結果を LaTeX で処理したり,ワープロに貼り込んだりする 道具立て 連続変数データをカテゴリーデータに変換 カテゴリーデータの再カテゴリー化 度数分布表と度数分布図の作成 散布図・箱髭図の描画 クロス集計(独立性の検定,フィ

  • 1