タグ

統計学とRに関するdelegateのブックマーク (10)

  • 統計学とRStudioの組み合わせがやばい|加藤貞顕

    ピースオブケイクでは、週に1度、数学の先生に来ていただいて、勉強会をやっている。ちょうど1年くらい前に有志メンバーではじめて、最初は線形代数、次に微分積分、次に機械学習を学んだ。 それで、いまやっているのは統計学なんだけど、今まででいちばん頭に入りにくい気がする。なんというか、納得感が低いのだ。 もちろん、先生のせいではまったくなく、こちらのレベルの問題なんだけど、入門向けに話してもらうと、いろんな理屈が「天下り」的に降ってくることになる(例:なんで標のときはn-1で割るの?)。かといってその根拠を、ちゃんと説明してもらうともっとわからない。 ひとつの手は、実用工学として、ツールとして、使い方を覚えて割り切って使うことだろう。たぶん、そうするのが正解なのだと思うけど、その場合でも、ツールの「手触り」を体感して納得してから覚えたい。 と思っていたら、先生に「Rつかえば? 便利だよ」とご紹介

    統計学とRStudioの組み合わせがやばい|加藤貞顕
  • Rを通じて統計学を学ぶ備忘録ブログ

    初心者のためのR解説ブログ2016 - 06 - 04 テキストマイニングはじめました〜その9〜 R テキストマイニング list Tweet 今回は テキストマイニング とコレスポンデンス分析(対応分析)について見ていきます。目標は以下の通りです。 自由記述の回答を成形し、対応分析を行うこと 今回利用する自由記述のデータは、 STAP細胞 でおなじみの小保方先生著「あの日」のアマゾンのレビューより抽出しました。また対応づけるために、星の数も同時に抽出しています。特に深く分析をしようとしていないので、特段おもしろい結果もでないと思いますが、 とりあえず始めます。 また、今回使用するフォントは「 ヒラギノ 丸ゴ」です。個人的にはよく使うフォントの一つです。 コレスポンデンス分析は、数量化3類と同様の手法と言われ、カテゴリカルデータの解析方法です。簡単に言うと、多次元クロス表の行と列に対応する

    Rを通じて統計学を学ぶ備忘録ブログ
  • ニコニコ動画(Re:仮)

    ニコニコ動画(Re:仮)
  • 統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト

    Rは統計をするうえでとても使い勝手の良いプログラミング言語です。 スライドでは、データの型の説明から、集計までに基的なプログラミング方法を説明します。 会社サイト:http://www.data-artist.com/Read less

    統計を始める方へ①_データ環境Rの基本的なプログラミング|データアーティスト
  • 今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ

    (※※※続編記事書きました→「使い分け」ではなく「妥当かどうか」が大事:重回帰分析&一般化線形モデル選択まわりの再まとめ) 今ちょうどadtech tokyo 2013の会期中で、職場からも近い&会社から行ってこいという指示が出たということで僕も色々セッションを聞いたり企業ブースのお話を聞いたりしてる*1ところです。 ところで、いくつかのセッションの中でキーワードとして「重回帰分析」という言葉が出てきてました。ま、それ自体はこのブログでもRによるデータ分析絡みで頻出だし、ぶっちゃけありふれた手法と言って良いでしょう。やりようによっては普通にExcelでもできますし、それだけ人口に膾炙していると言って良いのかもですね。 ただし。意外にも内部のパラメータというか細かい手法の分岐というか、それこそ普通の線形モデルvs.一般化線形モデル(バリエーション多数)があることを無視して漫然と重回帰分析をや

    今さら人に聞けない「重回帰分析の各手法の使い分け」 - 渋谷駅前で働くデータサイエンティストのブログ
  • R言語で統計解析入門: 目次1 テクニカルデータプレゼンテーション  梶山 喜一郎

    Technical Data presentation in R コピペで学ぶ Rでテクニカルデータプレゼンテーション 1.基礎統計解析編 グラフィックス・リテラシ-教育: 「図学 I ・図形情報 I ・統計学」科目 修了後のコースウェア 福岡大学工学部図学教室   梶山 喜一郎 ・つまみいで,学習しないように願います. ・データの可視化を体系・系統だったスキルにするために順を追って学習する. ・統計ブームに乗っている学習者も先人に感謝の気持ちを.さらに, ・確かなスキルにするために,教科書・解説書を理解し,Rスクリプトで確認. A. はじめに--ここは統計・解析の必要を味わった後で読めばよい まず,統計の手続きを実行する.慣れたら統計的に考えよう. 学校の統計学を復習--買った教科書とノートをまた読むだけ a. 測定と尺度 Measurement and scale b. 記述統計学の

  • むしろ数式が苦手だけど統計を勉強したいという人はRをやるといいかもしれない - Line 1: Error: Invalid Blog('by Esehara' )

    はじめに なぜか唐突にRブームが俺の中でやってきてしまってどうしようもないので、Rのを注文しまくってたりしていたら、下のようなの山が出来てしまいました。 これらのを付箋でペタペタしながら読み進めていくうちに、段々とRというのはどういう言語で、どういう風に勉強するといいのか、という方針が固まってきたので、ここにメモをしておきます。 Rとはどのような言語か 一言で、しかも乱暴に言ってしまうならば「統計に特化したPHP」というのが一番雰囲気を伝えられるかもしれない。いや、PHPの悪評は知っているし、ガチでRをやっている人にとっては嫌がられることもわかっているけど、あえてそういう説明が、あくまで入り口としてはわかりやすいのではないかと。 どういうことかというのを言い訳します。 自分が読んだ感じだと、統計というのは、「何らかのデータ」と「分析するためのツールとしての数式」と「その数式が意図する

    むしろ数式が苦手だけど統計を勉強したいという人はRをやるといいかもしれない - Line 1: Error: Invalid Blog('by Esehara' )
  • hamadakoichi blog

    2017/10/28 "第60回 データマイニング+WEB @東京( #TokyoWebmining 60th ) ー 機械学習 活用 祭り ー" を開催しました。 第60回 データマイニング+WEB @東京( #TokyoWebmining 60th ) ー 機械学習 活用 祭り ーEventbrite Google グループ 会場提供して下さった FreakOut さん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。多くの方々の参加を嬉しく思っています。 参加者ID・バックグラウンド一覧: 参加者セキココ:第60回 データマイニング+WEB @東京 セキココ (作成してくれた [Twitter:@komiya_atsushi] さんに感謝) 以下、全講師資料、関連資料、ツイートまとめです。 AGENDA: ■Opening Talk: O1.「デー

    hamadakoichi blog
  • Rが使えるフリをするための14の知識

    米国FDAで公認され、ハーバード大学やイェール大学の授業で利用されるようになり、世間での認知度が着実に上昇している統計用プログラミング環境のRだが、ユーザーなのか、ユーザーになりたいのか、ユーザーとして振舞いたいのか分からない人が増えてきた。 スノッブなユーザーとして振舞う場合は、Rの特性を語れる必要があるので、ユーザーになるよりもRへの知識や理解が必要で、実は難易度が高い行動である。それでもあえて意識の高いRユーザーとして振舞いたい人々のために、最低限求められる事のチェック・リストを用意してみた。 1. 参考文献や参考ページを押さえておく 一番大事な事だが、参考文献や参考ページを押さえておこう。公式サイトで配布されている、「R 入門」「R 言語定義」「R のデータ取り込み/出力」は持っておくべきだ。R-TipsやRjpWikiも参考になる。 2. 演算子や制御構文をマスターする 四則演算

    Rが使えるフリをするための14の知識
  • 統計・データ解析

    『Rで楽しむ統計』が出ました。サポートページ 『Rで楽しむベイズ統計入門』が出ました。サポートページ,第7章のRコードをStanで書き直したRで楽しむStan 全国学力・学習状況調査の個票の疑似データがこちらで公開されています。データ分析の練習に使えそうです。SSDSE(教育用標準データセット)も。 R 4.x では stringsAsFactors=FALSE がデフォルトになりましたが,サイトの古い記事ではそうなっていないところがあるかもしれません(read.csv() などで as.is=TRUE は不要になります(あってもかまいませんが))。 R 4.2 ではWindowsでもMac同様UTF-8がデフォルトになりました。もう fileEncoding オプションに "UTF-8","UTF-8-BOM" を指定する必要はなくなりそうです。一方で、SJIS(CP932)データの場

  • 1