タグ

statisticsとRに関するseuzoのブックマーク (11)

  • 整然データとは何か|Colorless Green Ideas

    整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。 はじめに データ分析の際には、データが扱いやすい形式になっている必要がある。データの中身がぐちゃぐちゃになっていたり、データの形式が統一されていなかったりすれば、分析は骨の折れる作業となる。 それでは、どのようなものがデータ分析において扱いやすい形式のデータになるのだろうか。この問題に対する唯一の正しい解答というものは存在しない。しかし、表の形式で表すことができるデータを考える場合、ハドリー・ウィッカム (Hadley Wickham) 氏が提唱した整然データ (tidy d

    整然データとは何か|Colorless Green Ideas
  • はじめての「R」

    2023/02/06追記: slideshareが非常に使いづらくなってしまったため、speakerdeckに転載しました。 https://speakerdeck.com/masaha03/hazimeteno-r 補足記事を書きました。併せてご覧ください。http://m884.hateblo.jp/entry/2012/12/03/232431Read less

    はじめての「R」
  • Rで度数分布表を作る

    a <- round(rnorm(30, mean=170, sd=5), 1) a [1] 173.0 168.6 168.5 164.2 167.3 170.6 162.7 168.0 170.8 [10] 175.7 166.0 166.5 162.4 172.6 170.1 170.2 164.2 167.1 [19] 163.8 163.4 168.1 168.7 171.1 164.6 166.3 177.0 170.0 [28] 173.3 170.7 169.0 このaに対して、度数分布表を作りたい。 質的データ(カテゴリカルデータ)なら、table関数を使って度数を集計できるのですが、量的データに対してtableを使うと、↓こんな感じになってしまいます。 table(a) a 162.4 162.7 163.4 163.8 164.2 164.6 166 166.3 16

    Rで度数分布表を作る
  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログ

    こんにちは、買物情報事業部でサーバサイドの開発を担当している荒引 (@a_bicky) です。 今回のエントリでは R で A/B テストの結果検証を行う方法の一例について紹介します。 エンジニアでも自分の関わった施策の効果検証のために簡単な分析をすることがあるかと思いますが、そんな時にこのエントリが役立てば幸いです。 なお、次のような方は対象外です。 A/B テストや KPI の設計に興味のある方 この辺には全く触れません プログラミング初心者 わからない単語が大量に出てくるでしょう R で統計学や機械学習の手法をバリバリ使いたい方 世の中の “分析” の多くは集計処理がメインです Python, Julia など既に分析する上で使い慣れた言語・ツールがある方 今回のエントリ程度の内容であればわざわざ乗り換える必要もないでしょう OS は Mac を前提として説明するので、Windows

    A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログ
  • 猛暑日の増加

    [2018-07-20] as.POSIXct() を as.Date() に変えました。 東京管区気象台の東京における雷日数や真夏日等の日数の変化というページを見ると,猛暑日(日最高気温35℃以上)の日数が1876年以来著しく増加していることがわかる。ところが,平均気温を見ると,地球温暖化・都市化の影響で徐々に増加しているが,激しく変わっているようには見えない。平均ではなくて猛暑日の日数を見るべきであるという議論もある。しかし,「猛暑日」(日最高気温35℃以上)や「真夏日」(日最高気温30℃以上)のような分布の裾の日数は,何℃で切るかによって印象が大きく異なる。気温変化を誇張することにならないか。 「東京」の観測地点は2014年12月2日に約900m離れた地点に移転している。詳しくは「東京」の観測地点の移転について(PDF,2014年11月14日,気象庁観測部)を参照されたい。 東京の日

  • Rで線形単回帰分析 - matsuou1の日記

    次回のTokyo.Rの開催が近づいてきたので、前回の復習を兼ねてRで回帰分析をやってみます。 今回は最も単純な線形単回帰分析を行います。 回帰分析の流れ 回帰式を求める意義があるか検討する(説明変数と目的変数のグラフを作成する等) 回帰式を求める 回帰式の精度を確認する 回帰係数の検定を行う 信頼区間と予測区間を求める 回帰式を求める意義があるか検討 無相関なデータに対しても、数学的には回帰式が求められるため、検討しておくことは重要です。 データはマンガでわかる統計学 回帰分析編のデータを使用してみます。 ある喫茶店のアイスティーの売り上げとその日の最高気温についてのデータです。 > norns temperture icetea 8/22 29 77 8/23 28 62 8/24 34 93 8/25 31 84 8/26 25 59 8/27 29 64 8/28 32 80 8/2

    Rで線形単回帰分析 - matsuou1の日記
  • biostatistics | バイオスタティスティクス | 生物統計学

    農学生命情報科学特論 I @東京大学アグリバイオインフォマティクス教育研究ユニット (2023-10) プログラミング言語未経験者を対象とした Python 入門講義。農学や分子生物学などの分野で利用される Python の最新事例を紹介しながら、Python の基礎文法の講義を行う。

  • The Comprehensive R Archive Network

    <h1>The Comprehensive R Archive Network</h1> Your browser seems not to support frames, here is the <A href="navbar.html">contents page</A> of CRAN.

  • R - 事始め

    R - 事始め     Last modified: Jul 09, 2015 以下は,Macintosh の場合についてです。 Windows の場合は,神戸大学の中澤先生のページを参照してください。 Linux の場合は,東海大学の山先生のページを参照してください。 R 一般については,R - 統計解析とグラフィックスの環境(山先生)を参照すると良いでしょう。 。 まず,必要なものをダウンロードしましょう。最新バージョンは,最寄りの CRAN ミラーサイトにあります 以下のどちらかの URL を開いてください。 ミラーサイト 統計数理研究所 ミラーサイト 山形大学 表示されるページの中の,Download R for (Mac) OS X をクリックします。 表示されるページの中の,R-3.xx.x.pkg をクリックします。 ファイルがダウンロードされます。 ダウンロードした R

  • R のインストール - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですopenSUSE10.2 Linux 版インストール † YaST2を立ち上げインストールソースの変更を行う。 追加ボタンでhttpを選択。サーバー名に software.opensuse.org/download/science/openSUSE_10.2/を入力 改めてソフトウエア管理からインストールする。 たぶん他のバージョンやyumを用いて/etc/yum.repos.dの変更でもできると思います。 やってませんが。 CRANミラーでのSuSE用r-baseのアップが遅いのですが、こちらのリポジトリにしっかりアップされていました。 suse10.3の場合、リポジトリをsoftware.opensuse.org/download/science/openSUSE_10.3/とすればでき

  • 1