タグ

Rに関するseuzoのブックマーク (21)

  • 整然データとは何か|Colorless Green Ideas

    整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。 はじめに データ分析の際には、データが扱いやすい形式になっている必要がある。データの中身がぐちゃぐちゃになっていたり、データの形式が統一されていなかったりすれば、分析は骨の折れる作業となる。 それでは、どのようなものがデータ分析において扱いやすい形式のデータになるのだろうか。この問題に対する唯一の正しい解答というものは存在しない。しかし、表の形式で表すことができるデータを考える場合、ハドリー・ウィッカム (Hadley Wickham) 氏が提唱した整然データ (tidy d

    整然データとは何か|Colorless Green Ideas
  • 理系が企業で働くってどういうこと?——『バイオ技術者・研究者になるには』著者・堀川晃菜さんインタビュー | Lab-On|研究の未来をデザインするメディア

    株式会社POLは、2022年7月31日をもちまして「LabBase X」「LabBase奨学金検索」「Lab-On」のサービス提供を終了させていただくこととなりました。 サービス開始より、長きにわたり多くのお客様にご利用いただきまして誠にありがとうございました。サービス終了に伴い、皆様には多大なご迷惑をおかけ致しますことを深くお詫び申し上げます。今後とも弊社サービスをご愛顧くださいますようお願い致します。 ■提供終了サービス ・LabBase X ・LabBase奨学金検索 ・Lab-On ■サービス提供終了日 2022年7月31日 ■お問い合わせ先 株式会社POL 電話番号:03-5962-9962

    理系が企業で働くってどういうこと?——『バイオ技術者・研究者になるには』著者・堀川晃菜さんインタビュー | Lab-On|研究の未来をデザインするメディア
    seuzo
    seuzo 2017/08/31
    とあるオフィスで「Rを起動したら、まずセルを方眼紙状にして... え?セルがないって? それじゃあお役所のフォームできないじゃないか! 仕事にならん!!」
  • はじめての「R」

    2023/02/06追記: slideshareが非常に使いづらくなってしまったため、speakerdeckに転載しました。 https://speakerdeck.com/masaha03/hazimeteno-r 補足記事を書きました。併せてご覧ください。http://m884.hateblo.jp/entry/2012/12/03/232431Read less

    はじめての「R」
  • 『【R】factor型から数値型へ変換、桁区切りのカンマがある場合』

    read.table()すると数値のはずがfactorになることがある。 桁区切りのカンマが無い場合、 as.numeric(as.character(aaa)) 桁区切りのカンマがある場合、 上述ではNAが生成されるWarningがでる。 ===== 警告メッセージ: 強制変換により NA が生成されました ===== そこで、as.numeric()とする前に、カンマを除去する必要がある。 ===== as.numeric(gsub(",", "", aaa)) =====

    『【R】factor型から数値型へ変換、桁区切りのカンマがある場合』
    seuzo
    seuzo 2016/05/04
  • Rで度数分布表を作る

    a <- round(rnorm(30, mean=170, sd=5), 1) a [1] 173.0 168.6 168.5 164.2 167.3 170.6 162.7 168.0 170.8 [10] 175.7 166.0 166.5 162.4 172.6 170.1 170.2 164.2 167.1 [19] 163.8 163.4 168.1 168.7 171.1 164.6 166.3 177.0 170.0 [28] 173.3 170.7 169.0 このaに対して、度数分布表を作りたい。 質的データ(カテゴリカルデータ)なら、table関数を使って度数を集計できるのですが、量的データに対してtableを使うと、↓こんな感じになってしまいます。 table(a) a 162.4 162.7 163.4 163.8 164.2 164.6 166 166.3 16

    Rで度数分布表を作る
  • RユーザーがLaTeXユーザーと仲良くするべき理由 - Qiita

    TeX & LaTeX Advent Calendar 2015 の22日目の記事です。昨日は @termoshttさんの「今さら人に聞けない、Beamerの基 」でした。 これまでの担当の方々に比べるとLaTeX力が圧倒的に少ないのですが、今日は、主に統計解析のために利用されるR言語でLaTeXが役立っている点についての記事を書くことでLaTeX職人さんたちに感謝の気持ちを伝えたいと思います(え。また、Rユーザーの方には少しでもRとLaTeXの相性の良さを伝えられればと思います。LaTeXで脱わーどを目指しましょう。 RユーザーがLaTeXを使うべき理由 LaTeXユーザーの方には言わずもがなですが、Rを使っている人でLaTeXも使う、という人は案外少ないように感じます。ですが、今回の記事で書くように、RとLaTeXを組み合わせることでより強力な表現ができたりしてあれこれ捗ります(多分

    RユーザーがLaTeXユーザーと仲良くするべき理由 - Qiita
  • R vs Python:データ解析を比較 | POSTD

    主観的な観点からPythonとRの比較した記事は山ほどあります。それらに私たちの意見を追加する形でこの記事を書きますが、今回はこの2つの言語をより客観的な目線で見ていきたいと思います。PythonとRを比較をしていき、同じ結果を引き出すためにはそれぞれどんなコードが必要なのかを提示していきます。こうすることで、推測ではなく、それぞれの言語の強みと弱みの両者をしっかりと理解できます。 Dataquest では、PythonとRの両方の言語のレッスンを行っていますが、データサイエンスのツールキットの中では両者ともそれぞれに適所があります。 この記事では、NBA選手の2013/2014年シーズンの活躍を分析したデータセットを解析していきます。ファイルは ここ からダウンロードしてください。解析はまずPythonとRのコードを示してから、その後に2つの異なるアプローチを解説し議論していきます。つま

    R vs Python:データ解析を比較 | POSTD
  • A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログ

    こんにちは、買物情報事業部でサーバサイドの開発を担当している荒引 (@a_bicky) です。 今回のエントリでは R で A/B テストの結果検証を行う方法の一例について紹介します。 エンジニアでも自分の関わった施策の効果検証のために簡単な分析をすることがあるかと思いますが、そんな時にこのエントリが役立てば幸いです。 なお、次のような方は対象外です。 A/B テストや KPI の設計に興味のある方 この辺には全く触れません プログラミング初心者 わからない単語が大量に出てくるでしょう R で統計学や機械学習の手法をバリバリ使いたい方 世の中の “分析” の多くは集計処理がメインです Python, Julia など既に分析する上で使い慣れた言語・ツールがある方 今回のエントリ程度の内容であればわざわざ乗り換える必要もないでしょう OS は Mac を前提として説明するので、Windows

    A/B テストで施策の効果を検証!エンジニアのための R 入門 - クックパッド開発者ブログ
  • R-Source

    行列操作の手法を散発的に紹介する. 行列の大きさ 行列は dim 属性という次元の属性を持っており,(行数 ,列数) という長さ 2 の整数ベクトルの形をしている.行列に付けられた dim 属性を見る場合は関数 dim() ,nrow() ,ncol() を用いる. x <- matrix(1:6, nrow=2, ncol=3) # 2 * 3 の行列を作る dim(x) # dim 属性を調べる [1] 2 3 nrow(x) # 行数 : dim(x)[1] でも同じ結果が得られる [1] 2 ncol(x) # 列数 : dim(x)[2] でも同じ結果が得られる [1] 3 行列の大きさを変えるには,再度 matrix() を使う方法と dim を使って行列の大きさを強制変更する方法とがある.dim を用いる場合の変更結果は,matrix() を使って行列サイズを変更した場合と同

    seuzo
    seuzo 2015/08/31
  • 猛暑日の増加

    [2018-07-20] as.POSIXct() を as.Date() に変えました。 東京管区気象台の東京における雷日数や真夏日等の日数の変化というページを見ると,猛暑日(日最高気温35℃以上)の日数が1876年以来著しく増加していることがわかる。ところが,平均気温を見ると,地球温暖化・都市化の影響で徐々に増加しているが,激しく変わっているようには見えない。平均ではなくて猛暑日の日数を見るべきであるという議論もある。しかし,「猛暑日」(日最高気温35℃以上)や「真夏日」(日最高気温30℃以上)のような分布の裾の日数は,何℃で切るかによって印象が大きく異なる。気温変化を誇張することにならないか。 「東京」の観測地点は2014年12月2日に約900m離れた地点に移転している。詳しくは「東京」の観測地点の移転について(PDF,2014年11月14日,気象庁観測部)を参照されたい。 東京の日

  • Tufte in R

    6th of July 2017: (1) New category - interactive plots made in Tufte-style with R - the first addition is basic line plot and basic barchart with the use of package highcharter; (2) Revised slopegraph in base graphics - Thomas Leeper has implemented his slopegraph functions into development version package on GitHub; (3) Revised sparklines in lattice get a gray bands (thanks to Bryan Urban for sha

    seuzo
    seuzo 2015/08/05
    プロット用ライブラリ
  • MacOSXのRでコンソール上では日本語使えるのにplotすると文字化けする場合の対処法 - konisimple log

    やっとMacのESSで日語がばけなくなった - Seeking for my unique color.を見て、 ~/.Rprofileというファイルを作り、 setHook(packageEvent("grDevices", "onLoad"), function(...){ grDevices::quartzFonts(serif=grDevices::quartzFont( c("Hiragino Mincho Pro W3", "Hiragino Mincho Pro W6", "Hiragino Mincho Pro W3", "Hiragino Mincho Pro W6"))) grDevices::quartzFonts(sans=grDevices::quartzFont( c("Hiragino Kaku Gothic Pro W3", "Hiragino Kaku

    MacOSXのRでコンソール上では日本語使えるのにplotすると文字化けする場合の対処法 - konisimple log
    seuzo
    seuzo 2015/04/17
  • Mac OSXのRで日本語をプロットしたい - 驚異のアニヲタ社会復帰の予備

    R13.2なのだが、Macでプロットするとき、日語がたいてい化ける。 テキストエンコーディング?なにそれおいしいの?という情弱っぷりなので、グーグル先生に聞いた。 R、日語、プロット、なんかでググるとたくさん出てきた。生態学のデータ解析 - R 作図の日語表示を参考にすると >|r|| setHook(packageEvent("grDevices", "onLoad"), function(...){ if(.Platform$OS.type == "windows") grDevices::windowsFonts(sans ="MS Gothic", serif="MS Mincho", mono ="FixedFont") if(capabilities("aqua")) grDevices::quartzFonts( sans =grDevices::quartzFont(

    Mac OSXのRで日本語をプロットしたい - 驚異のアニヲタ社会復帰の予備
    seuzo
    seuzo 2015/04/17
  • Rで線形単回帰分析 - matsuou1の日記

    次回のTokyo.Rの開催が近づいてきたので、前回の復習を兼ねてRで回帰分析をやってみます。 今回は最も単純な線形単回帰分析を行います。 回帰分析の流れ 回帰式を求める意義があるか検討する(説明変数と目的変数のグラフを作成する等) 回帰式を求める 回帰式の精度を確認する 回帰係数の検定を行う 信頼区間と予測区間を求める 回帰式を求める意義があるか検討 無相関なデータに対しても、数学的には回帰式が求められるため、検討しておくことは重要です。 データはマンガでわかる統計学 回帰分析編のデータを使用してみます。 ある喫茶店のアイスティーの売り上げとその日の最高気温についてのデータです。 > norns temperture icetea 8/22 29 77 8/23 28 62 8/24 34 93 8/25 31 84 8/26 25 59 8/27 29 64 8/28 32 80 8/2

    Rで線形単回帰分析 - matsuou1の日記
  • Rのパッケージ管理 (アップデート 、読込済みパッケージ一覧の表示方法) - Qiita

    1.インストール済みパッケージ・リストの表示 libary() 関数 libary() 関数を打つと、いま手元の R に読み込んで使用しているパッケージの名称一覧を表示させることができます abind Combine multi-dimensional arrays actuar Actuarial functions adabag Applies multiclass AdaBoost.M1, AdaBoost-SAMME and Bagging adaptivetau Tau-leaping stochastic simulation ADGofTest Anderson-Darling GoF test adimpro Adaptive Smoothing of Digital Images akima Interpolation of irregularly spaced data

    Rのパッケージ管理 (アップデート 、読込済みパッケージ一覧の表示方法) - Qiita
    seuzo
    seuzo 2015/04/11
  • Rで素因数分解 - StatsBeginner: 初学者の統計学習ノート

    昨日、「素因数分解ってRでどうやるのかな」と思ってググったら、gmpというパッケージがあるようです。(ここで解説をみつけた。) install.packages("gmp", dep=TRUE) library(gmp) factorize(as.bigz("●●●●")) # ●●●●のところに素因数分解したい数字を入れる とやると一瞬でできました。 たとえば5656を素因数分解してみるとこんな感じ > library(gmp) > factorize(as.bigz("5656")) Big Integer ('bigz') object of length 5: [1] 2 2 2 7 101 ちなみに、上記の解説をみつけたページ(ここ)では、パッケージの呼び出しにlibrary()ではなくrequire()が使われていたが、両者の違いについてはここで解説されていた。あまり気にしなく

    Rで素因数分解 - StatsBeginner: 初学者の統計学習ノート
    seuzo
    seuzo 2015/04/11
  • biostatistics | バイオスタティスティクス | 生物統計学

    農学生命情報科学特論 I @東京大学アグリバイオインフォマティクス教育研究ユニット (2023-10) プログラミング言語未経験者を対象とした Python 入門講義。農学や分子生物学などの分野で利用される Python の最新事例を紹介しながら、Python の基礎文法の講義を行う。

  • The Comprehensive R Archive Network

    <h1>The Comprehensive R Archive Network</h1> Your browser seems not to support frames, here is the <A href="navbar.html">contents page</A> of CRAN.

  • R - 事始め

    R - 事始め     Last modified: Jul 09, 2015 以下は,Macintosh の場合についてです。 Windows の場合は,神戸大学の中澤先生のページを参照してください。 Linux の場合は,東海大学の山先生のページを参照してください。 R 一般については,R - 統計解析とグラフィックスの環境(山先生)を参照すると良いでしょう。 。 まず,必要なものをダウンロードしましょう。最新バージョンは,最寄りの CRAN ミラーサイトにあります 以下のどちらかの URL を開いてください。 ミラーサイト 統計数理研究所 ミラーサイト 山形大学 表示されるページの中の,Download R for (Mac) OS X をクリックします。 表示されるページの中の,R-3.xx.x.pkg をクリックします。 ファイルがダウンロードされます。 ダウンロードした R

  • R のインストール - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですopenSUSE10.2 Linux 版インストール † YaST2を立ち上げインストールソースの変更を行う。 追加ボタンでhttpを選択。サーバー名に software.opensuse.org/download/science/openSUSE_10.2/を入力 改めてソフトウエア管理からインストールする。 たぶん他のバージョンやyumを用いて/etc/yum.repos.dの変更でもできると思います。 やってませんが。 CRANミラーでのSuSE用r-baseのアップが遅いのですが、こちらのリポジトリにしっかりアップされていました。 suse10.3の場合、リポジトリをsoftware.opensuse.org/download/science/openSUSE_10.3/とすればでき