タグ

rに関するTYKのブックマーク (225)

  • Why I use ggplot2

    David Robinson Director of Data Scientist at Heap, works in R. Email Twitter Github Stack Overflow Subscribe Recommended R Bloggers RStudio Blog R4Stats Simply Statistics Upfront If you’ve read my blog, taken one of my classes, or sat next to me on an airplane, you probably know I’m a big fan of Hadley Wickham’s ggplot2 package, especially compared to base R plotting. Not everyone agrees. Among th

    Why I use ggplot2
    TYK
    TYK 2016/02/22
  • [Stan] 二つの時系列データの間に「差」があるか判断するには

    詳しい経緯は このまとめ を参照してください。時間軸でぶった切って各時点で検定を使う手法は、百歩譲って「差があるかどうか」は判定できるかもしれないけど、「どれほど異なるのか」については何も言えない。「どの時刻から異なるか」についても言えるか分からない。そこでベイズ統計モデリングで判断しようと思います。ベイズ統計モデリングでは多くの事前知識を仮定としてモデルに組み込みますが、検定も多くの仮定を前提にしている点は同様と思います。 データは雰囲気だけ似せて自作しました。野生型100個体、変異体10個体で1~24まで1時間ずつ測定して24時点としました。まとめを見ると144時間みたいですが24時間に簡略化します。データの構成は以下です。 type X1 X2 … X23 X24 0 0.071 0.555 … -0.236 -0.597 0 0.445 0.483 … -0.149 0.231 0

    [Stan] 二つの時系列データの間に「差」があるか判断するには
  • Rで解析:PCA,MCAのインタラクティブな表示「explor」パッケージ

    PCA,MCA解析のインタラクティブな表示に便利なパッケージです パッケージバージョンは0.3.9.9000。実行コマンドはR version 4.2.2で確認しています。 パッケージのインストール下記、コマンドを実行してください。 #パッケージのインストール install.packages("devtools") devtools::install_github("juba/scatterD3") devtools::install_github("juba/explor")実行コマンド詳細はコメント、パッケージのヘルプを確認してください。 #パッケージの読み込み library("explor") ###データ例の作成##### n <- 100 #PCA用のデータ PCAData <- data.frame(row.names = paste0("Group", seq(n)),

    Rで解析:PCA,MCAのインタラクティブな表示「explor」パッケージ
    TYK
    TYK 2015/12/23
  • 北海道大学 低温科学研究所

    低温科学研究所は「寒冷圏および低温環境における自然現象の基礎と応用の研究」を目的とする、文部科学省認定の共同利用・共同研究拠点として、国内外の研究機関と連携したプロジェクト等を推進しています 人事公募2024.07.05 教員の公募:水・物質循環部門・助教1名、応募締切:令和6年9月30日(月)必着 お知らせ2024.07.02 低温研で大学院生活を送る学生たちの日常や研究を紹介する「低温研で活躍する学生」コーナーを更新しました。 共同研究2024.06.27 研究会:過去2000年間の北極海古環境に関する研究集会 7月 8日(月) - 9日(火) 講義室 および オンライン お知らせ2024.06.25 掲載:低温研ニュース 2024年 6月 No.57 共同研究2024.06.20 研究会:環オホーツク陸海結合システムの冠動脈:対馬暖流系の物質循環 7月 2日(火) - 3日(水) 講

    TYK
    TYK 2015/12/11
    RをつかったGLM, GLMMなどの解析の解説用メモ
  • Plotly | Make charts and dashboards online

    Loading...

    TYK
    TYK 2015/11/18
    データの可視化、グラフ化ライブラリ
  • グラフ・ネットワーク分析で遊ぶ(2):最短経路長など - 渋谷駅前で働くデータサイエンティストのブログ

    前回の記事に引き続き主に{igraph}の各関数で遊びながらグラフ理論・ネットワーク分析を学ぶこのシリーズですが、今回は様々なノード間の特徴量について見てみます。もちろん今回も参考文献はこちら。 ネットワーク分析 (Rで学ぶデータサイエンス 8) 作者: 鈴木努,金明哲出版社/メーカー: 共立出版発売日: 2009/09/25メディア: 単行購入: 5人 クリック: 62回この商品を含むブログ (9件) を見る データセットは前回適当に生成したグラフのものと、C elegansと、さらに以前使った『レ・ミゼラブル』の人物相関図を対比のために併用しようと思います。 最短経路長とダイクストラ法 前回適当に生成したグラフを今回も使ってみましょう。 > d [,1] [,2] [1,] 1 8 [2,] 3 1 [3,] 1 2 [4,] 6 2 [5,] 3 8 [6,] 5 3 [7,] 6

    グラフ・ネットワーク分析で遊ぶ(2):最短経路長など - 渋谷駅前で働くデータサイエンティストのブログ
    TYK
    TYK 2015/11/17
    経路探索
  • ggplot2に関する資料まとめ - Qiita

    そろそろワンストップなまとめ記事があってもいいはずと思ったので、個人的なメモとしてまとめました。 2016/06/10追記: 資料1件追加 2016/03/15追記: ggplot2 v2向けに一部修正 ggplot2のイメージをつかもう まずはこのggplot2がどういうものなのかをつかみましょう。 ggplot2の完全な初心者向け ggplot2に初めて触れるという方は、まずこのスライドを一読されるのをオススメします: ggplot2によるグラフ化@HijiyamaR#2 ※Slideshareリンク ggplot2を理解するためには、その文法をイメージできるようになることが近道です。このスライドは従来のplotとggplot2との違いをわかりやすく解説してあります。まずはレイヤーの感覚をつかむためにも、提示してあるサンプルコードをひたすら打ちましょう。手を動かす、大事。 ggplot

    ggplot2に関する資料まとめ - Qiita
    TYK
    TYK 2015/11/15
  • eyetrackingR

    eyetrackingR is an R package designed to make dealing with eye-tracking data easier. It handles tasks along the pipeline from raw data to analysis and visualization -- as illustrated in the eyetrackingR workflow. Check out the vignettes to the left for some gentle introductions to using eyetrackingR for several popular types of analyses, including growth-curve analysis, onset-contingent reaction t

    TYK
    TYK 2015/10/16
    視線計測データ解析のRライブラリ
  • Pythonや機械学習、そして言語の競争について – 極めて主観的な見地から | POSTD

    (訳注:2016/1/5、いただいた翻訳フィードバックを元に記事を修正いたしました。) よくある主観的で痛烈な意見を題名に付けたクリックベイト(クリック誘導)記事だろうと思われた方、そのとおりです。以前指導してくれた教授から教わったある洞察/処世術は、些細でありながら私の人生を変えるマントラとなったのですが、私がこの記事を書いたのはそれによるものです。「同じタスクを3回以上繰り返す必要があるなら、スクリプトを書いて自動化せよ」 そろそろ、このブログはなんだろうと思い始めているのではないでしょうか。半年振りに記事を書いたのですから。ツイッターで書いた Musings on social network platforms(ソーシャル・ネットワークプラットフォームについてじっくり考える) はさておき、この半年の間書き物をしていないというのはうそです。正確には、400ページの を書きました。

    Pythonや機械学習、そして言語の競争について – 極めて主観的な見地から | POSTD
    TYK
    TYK 2015/10/01
    言語の比較
  • RStanとShinyStanによるベイズ統計モデリング入門

    第50回 TokyoR 発表資料 Stanコードは下のサイトで公開しております。 https://github.com/teuder/TokyoR50 Read less

    RStanとShinyStanによるベイズ統計モデリング入門
    TYK
    TYK 2015/09/12
  • Rのこれだけ覚えておけばいいdata.tableの使い方 - Qiita

    library(data.table) data.tableは簡単に言うとサイズの大きいデータフレーム。 確かに高速。慣れると大規模データはこれなくして扱えない。 データフレームと扱い方が大きく異なるが、これだけ抑えておけば十分ということをまとめた。 data.tableには行名がない dplyrとセットで使うことが多いので、同時に呼び出しておくといい ただしtidyr(集計用ライブラリ)までは使わなくていい

    Rのこれだけ覚えておけばいいdata.tableの使い方 - Qiita
    TYK
    TYK 2015/08/28
  • 「Rプログラミング入門」をPythonで書き直す - めもめも

    何の話かというと RStudioではじめるRプログラミング入門 作者: Garrett Grolemund,大橋真也,長尾高弘出版社/メーカー: オライリージャパン発売日: 2015/03/25メディア: 大型この商品を含むブログを見る 某編集長から上記の書籍が送られてきて、「これは、次はRのを書けという指示か????」と勘ぐってみたものの、筆者はPython派なので、「これと同じことは全部Pythonでもできるんだよー」と言いたくなって、このエントリーを書き始めた次第です。ちなみに、この、Rの入門書としてはよくできているので、これのPython版ができたら、それはそれで役に立つ気もします。 なお、このエントリーでは、あくまでコードの部分だけを書き直して、RとPythonの差異についての説明だけを行ないます。コードそのものの説明については、上記の書籍をご購入ください。 環境準備 IP

    「Rプログラミング入門」をPythonで書き直す - めもめも
    TYK
    TYK 2015/08/27
  • Rでとことん相関

    研究会でせっかく資料作ったのでこちらにもアップしたいと思います。内容は「相関」について。 心理学をやっている人ならば恐らくは誰でも知っている相関係数ですが、あらためて調べてみると色々出来ることは多いですね。 なお、統計初心者向けの内容となっております。 1.  相関(correlation)とは 相関とは、2 つの変数間の関係性を記述するための統計指標を指します。例えば,変数 A の値が大きいほど,変数 B が大きければ正の相関。変数 A の値が大きいほど,変数 B が小さければ負の相関です。ここあたりは基ですね。 特に Pearson の積率相関係数では共分散を用いて算出されます。 2.  共分散(covariance) 共分散は2 変数の散布度についての統計指標です。それぞれの観測変数が 2 つの平均値からどの程度離れているのか(平均からの偏差)を元に算出されて、直線状に並んだときが

    Rでとことん相関
  • RPubs - Vignette of imhistR

    TYK
    TYK 2015/08/06
    画像のヒストグラムを調べる
  • Rで解析:インタラクティブなヒートマップ!D3.jsを利用した「d3heatmap」パッケージの紹介

    ヒートマップをインタラクティブに操作する「d3heatmap」パッケージがリリースされました。パッケージのメインコマンド”d3heatmap”はgplotsの「heatmap.2」コマンドと多くが共通しているので、これらパッケージの使用経験があるとすぐに使いこなせると思います。 ためしにパッケージより「400*50の20,000データ」を出力したところ、多少のモタつきはありますがぐりぐり動きました。サーバー経由でなければ一般的な使用方法には十分かと思います。なお、距離の計算は搭載メモリに依存しますのでデータ数は使用環境により異なります。 また、紹介する出力結果は利便性を考えて「50*10の500データ」としています。最下部に表示しています。ぐりぐり動かしてみてください。 Rを使用し始めたころから考えると、これほど多くのインタラクティブな結果を出力するパッケージがリリースされるとは思って

    Rで解析:インタラクティブなヒートマップ!D3.jsを利用した「d3heatmap」パッケージの紹介
    TYK
    TYK 2015/06/26
  • My ggplot2 cheat sheet: Search by task

    An easy-to-use guide to dozens of useful ggplot2 R data visualization commands in a handy, searchable table. There’s a reason ggplot2 is one of the most popular add-on packages for R: It’s a powerful, flexible and well-thought-out platform to create data visualizations you can customize to your heart’s content. But it also can be a bit overwhelming. While I find the logic of plot layers to be intu

    My ggplot2 cheat sheet: Search by task
    TYK
    TYK 2015/06/19
  • Perl、C、Scala…プログラミング言語擬人化計画2|【Tech総研】

    前回に引き続き、C、shell、Perl、R、VB、Scala、ActionScript。7つのプログラミング言語を擬人化しました。話題沸騰中の子もいれば、舞台の中心からちょっとはずれてきてしまっている子もいる。プログラミング言語のセンター争いは熾烈です。 Perlは1987年12月、アメリカのウォール夫の元で生を受ける。父のラリーはコンピュータや言語学に精通し、母も中世ルネサンスや言語学を専攻する、高い教養を持つ両親の元で育った。 父の教えは厳しかったが、同時に自由でもあった。父は教育の中で、よくこの言葉を口にした。 「方法は1つだけじゃない」 (There's more than one way to do it) 何かを実現しようと思った時、それを達成する方法は1つだけじゃない。何通りも考えられる。そんな父の教えは、彼女の人格形成に大きな影響を与えた。 「こんな風にやってみたらどう

    Perl、C、Scala…プログラミング言語擬人化計画2|【Tech総研】
  • 統計を始めたい人に僕がPythonよりRを勧める理由 - 蛍光ペンの交差点

    今回は「ほぼRしか使ったことがない」人間*1が、できる限り二者の優劣をくっきり述べる。 僕はほとんどRしか使ったことがない。Pythonはtfidfやクイックソートをライブラリ無しで実装した程度。 前半の主張は以下である。 「過去のRでの10回程度の解析において、Rで不十分さを感じてPythonを使った経験は1度だけ、しかも部分的にしかなかった。Rの使いにくさを感じることも最近はだいぶ無くなった。だから初学者には「事足りる」Rを勧める。」 前半の主張 今までにRでやった解析の内容は大体以下である。 (未発表)は途中で頓挫した、もしくは現在進行中/契約により詳細&解析結果の公開不可能のプロジェクトである。 [ビジネス・製造業] 米国新車価格の線形重回帰分析(授業の期末課題) [ビジネス・不動産不動産賃貸価格の線形重回帰分析(発表スライド) [ビジネス・IT] EコマースサイトのARIMA

    統計を始めたい人に僕がPythonよりRを勧める理由 - 蛍光ペンの交差点
    TYK
    TYK 2015/06/12
  • RPubs - このパッケージがすごい2014: stringr

    TYK
    TYK 2015/06/10
    Rでの文字列操作
  • hnagata.net

    TYK
    TYK 2015/05/28