タグ

Rに関するHashのブックマーク (76)

  • CellTree: an R/bioconductor package to infer the hierarchical structure of cell populations from single-cell RNA-seq data - BMC Bioinformatics

    CellTree: an R/bioconductor package to infer the hierarchical structure of cell populations from single-cell RNA-seq data Software Open access Published: 13 September 2016 CellTree: an R/bioconductor package to infer the hierarchical structure of cell populations from single-cell RNA-seq data David A. duVerle1,5, Sohiya Yotsukura2, Seitaro Nomura3, Hiroyuki Aburatani3 & …Koji Tsuda1,4,5 Show autho

    CellTree: an R/bioconductor package to infer the hierarchical structure of cell populations from single-cell RNA-seq data - BMC Bioinformatics
  • 【R】絶対に身につけて欲しいR術 - 歩いたら休め

    友人が、後輩にこちらの記事を紹介していました。 www.shiningmaru.com Excelの基的な機能や、分析の心構えが過不足なく紹介されている素晴らしい記事だと思います!しかし、私は統計用環境のR言語が大好きで、分析のほとんどの場面で、RはExcelより簡単に記述できると思っています。 というわけで、「もしRで同じ内容の記事を書くとどうなるのか」というパロディーを書いてみることにしました。 クライアントとかと接しながらいつも思うのですが、Rすら出来ない人多すぎ。あなたたちが作った適当なフォーマットと手打ちのExcelで苦労するの誰だと思ってるの。そこで今回は私の「社会人であればこんくらいは最低限出来てよ」というフラストレーションをぶつけた「これだけ最低限知ってろ、R編」です。 これくらい出来ないと人間ではない。獣(ケダモノ)である。 Rで出来ること あるべきフォーマット/作って

    【R】絶対に身につけて欲しいR術 - 歩いたら休め
  • Exploring Geospatial Intelligence using SparkR on Amazon EMR | Amazon Web Services

  • 非負値行列因子分解(NMF)によるレコメンドのちょっとした例 - About connecting the dots.

    最近線形代数についていろいろ読みなおしたりしてるのですが(線形代数チートシートを前の記事でまとめてあります),その一環でレコメンドアルゴリズムについていくつか試してみたので,それを解説します.順序としては,基の協調フィルタリング(ユーザベースド,アイテムベースド)→特異値分解(SVD)→非負値行列因子分解(NMF)になります. 基的な考え方 ここで取り扱うのは,すべて以下のようなユーザ×商品のマトリックスをベースとしたレコメンドになります*1.ここでは映画レンタルサービスを例にして考えます.6人のユーザが,4つの映画*2のうちレンタル視聴したものについては,1-5点の5段階評価を行いました.0になっているものは「みていない」ということになります. まずはざっと評価の状況をみると,「千と千尋の神隠し」が最もよく視聴されていて,6人中4人がみています.次にみられているのは「となりのトトロ」

  • 『Sparkによる実践データ解析』という本の付録を執筆しました - ほくそ笑む

    リクルートの高柳さんと共同で『Sparkによる実践データ解析』というの付録を執筆しました。 Sparkによる実践データ解析 ―大規模データのための機械学習事例集 作者: Sandy Ryza,Uri Laserson,Sean Owen,Josh Wills,石川有,Sky株式会社玉川竜司出版社/メーカー: オライリージャパン発売日: 2016/01/23メディア: 大型この商品を含むブログ (4件) を見る 執筆した付録の内容は「SparkRについて」です。 SparkR は、R 言語から Spark を使うためのパッケージで、公式サポートされています。 SparkR については、以前 Spark Meetup で発表しました。 Spark Meetup 2015 で SparkR について発表しました #sparkjp - ほくそ笑む このときはまだ、機能として不十分な点が目立ちま

    『Sparkによる実践データ解析』という本の付録を執筆しました - ほくそ笑む
    Hash
    Hash 2016/01/14
  • SparkR (R on Spark) - Spark 3.5.1 Documentation

    SparkR (R on Spark) Overview SparkDataFrame Starting Up: SparkSession Starting Up from RStudio Creating SparkDataFrames From local data frames From Data Sources From Hive tables SparkDataFrame Operations Selecting rows, columns Grouping, Aggregation Operating on Columns Applying User-Defined Function Run a given function on a large dataset using dapply or dapplyCollect dapply dapplyCollect Run a g

  • RStudio

    Grow your data science skills at posit::conf(2024) August 12th-14th in Seattle

    RStudio
    Hash
    Hash 2015/11/28
    たっけえ
  • 政府統計の総合窓口(e-Stat)のAPIを使ってみよう [R編] - Qiita

    はじめに Qiita Rアドベント に政府統計ポータル(e-Stat)と R でサンタさんの12月の出費動向を調べてみたという良記事がありました。 とても参考になるのですが、ポータルからマウスで項目をクリックしていくのが大変です。特に最後の方のフェーズではページが強制的にフルスクリーンになってしまい、上記アドベントの操作を確認できなくなります。 そこでAPIを使ってみます。 その前に、e-Stat API を少し触ってみましょう。 公式説明PDFをパクる 恐れおおくも総務省統計局統計センター様謹製PDF の最後の事例をパクります。 RCurl でjson形式のデータを引っ張ってきます。次世代統計システムから取得した自分のアカウントが必要です。以下のコードで yourAPPID の部分を取得したID に変更してください。 さらに加えて、統計表IDや分類表IDが必要なんですが、後述します。 >

    政府統計の総合窓口(e-Stat)のAPIを使ってみよう [R編] - Qiita
  • データ分析のプロを目指すエンジニア必読の書 - ほくそ笑む

    福島真太朗『データ分析プロセス』を読みました。 データ分析プロセス (シリーズ Useful R 2) 作者: 福島真太朗,金明哲出版社/メーカー: 共立出版発売日: 2015/06/25メディア: 単行この商品を含むブログ (2件) を見る 「データ分析」とひとことで言っても、色々な人たちが色々な考え方で「データ分析」をやっていると思います。 その一大勢力として挙げられるのが「Excelで集計だけしてる人たち」です。これは特にマーケター出身の人が多いのではないでしょうか。*1 一方、最近のデータ分析界隈に増加していると思われるのが「機械学習ツールにデータを入れるだけ」の人たちです。 特にエンジニア出身の方が、上司に「データ分析が流行ってるみたいだから今日からデータ分析やって」と言われて泣きながらやっているケースが多いのではないかと。 そういう人たちは、機械学習についてある程度理解してお

    データ分析のプロを目指すエンジニア必読の書 - ほくそ笑む
    Hash
    Hash 2015/09/29
    プロは目指…さないけど半分が前処理以前というのがすごくよさそう Rの記憶掘り起こしがてらやってみたい
  • Home

    switch_axis_position Switches the axis position of the x or y axis in a ggplot2 plot.

  • biunit

    農学生命情報科学特論 I @東京大学アグリバイオインフォマティクス教育研究ユニット (2023-10) プログラミング言語未経験者を対象とした Python 入門講義。農学や分子生物学などの分野で利用される Python の最新事例を紹介しながら、Python の基礎文法の講義を行う。

    Hash
    Hash 2015/04/24
    R,べんりなパッッッケージある
  • Rubyが切り開く科学の未来 - ほげほげにゃ

    この記事はRuby Advent Calendar 2014の13日目の記事です。 初めに Ruby教育・研究に使おうという試みはRubyの黎明期からありました。 この時期の有名なパッケージとしてはバイオインフォマティクスのBioRubyや地球科学の電脳Rubyプロジェクトが有名です。 先述のBioRubyやGPhys(電脳Rubyの成果物)は現在も更新が続けられており、多数の利用者を抱えています。 しかし全体として見た場合、科学の分野で使われるLL言語としてRubyPythonやRの後塵を拝している印象があります。 科学計算における均質化、あるいはなぜPythonが着実に他言語のシェアを奪っているか 記事のようにこの分野ではPythonコミュニティが非常に活発で、機械学習など新しい技術は真っ先にPythonで実装されるようになっています。 しかし最近Rubyでも少しずつですが環境が充

    Rubyが切り開く科学の未来 - ほげほげにゃ
  • 認証がかかっています

    こちらのブログには認証がかかっています。 ユーザー名 パスワード Powered by Seesaa

    Hash
    Hash 2014/11/10
    中心極限定理を適当なデータを元にRでサンプリングして正規分布になることを確認してる. よい
  • 生態学データ解析 - ベイズ統計 & MCMC

    ここはベイズ推定と MCMC 法 (Markov Chain Monte Carlo method; マルコフ連鎖モンテカルロ法) 関連についてのペイジです 特に階層ベイズモデルについて [もくじ] ネット上の Bayes 推定・MCMC 計算の解説 「ベイズ推定を MCMC 計算で」なソフトウェアたち ベイズ推定と R ベイズファクターなど 書籍 べいじあんな生態学研究者 Ben Bolker Ottar N. Bjørnstad James S. Clark Kiona Ogle John Silader Christopher K. Wikle ネット上の Bayes 推定・MCMC 計算の解説 講義とか:統計学授業 や 出張統計学授業 解説記事: 岩波DS01 2016 階層ベイズモデルの解説記事 信学会誌ベイズ解説: 電子情報通信学会誌に書いた階層ベイズ解説 (2009 年 10

    Hash
    Hash 2014/08/22
  • (Rで)塩基配列解析

    (Rで)塩基配列解析 (last modified 2024/07/11, since 2010) このページは、RStudio (R含む)で生命科学系のデータ解析を行うためのテンプレート集です。このページに特化したチュートリアル(インストール | についてと基的な利用法)を一通り実践した上でご利用ください。より一般的なチュートリアルは、教科書の付録ページ(←読込に時間がかからなくなりました)にあるR1.010とR1.020で提供しています(2023/04/01)。 アグリバイオインフォマティクス、@Agribio_utokyo、アグリバイオの教科書、(Rで)塩基配列解析のサブページ What's new? (過去のお知らせはこちら) 生命科学研究のためのデジタルツール入門 第2版(監修:坊農秀雅・小野浩雅)が2024年6月末に出版されています。生命科学分野に参入してきた学生さんに、最新

  • STAP細胞関係のゲノムデータを解析してみた - biochem_fanのブログ

    記事の目的と注意 注意! 私は、NGS については amplicon sequencing の解析経験(しかも半年)しかない。記事は、データを解析して、STAP論文(Obokata et al, Nature 2014. Article と Letter)に対して何らかの結論を導くのが目的ではない。これだけリード数が少なくて、しかもサンプルがポリクローナルな混合物であることを考えると、ここから何かを結論するのは極めて慎重にならないといけないと思う。したがって、結果の「解釈」には立ち入らない(し、その能力もない)。記事は、「ネットで話題になっているデータを、自分も解析してみたい!」と、「行為」そのものに魅力を感じる方のために、私が行った操作の流れを紹介するものである。 私は当初 RNA-seq のデータを解析しようとしたが、リファレンス・トランスクリプトームに存在しない再構成後の T

    STAP細胞関係のゲノムデータを解析してみた - biochem_fanのブログ
    Hash
    Hash 2014/03/07
    なるほど, こうやるのか // ここに書かれているような解析作業ができれば野良からバイオインフォの世界に足突っ込めたりするんでしょうか
  • Rでt検定 1

    t検定の仮定 来,t検定には,さまざまな仮定が伴うものである。 各群の標が,いずれも正規母集団から得られたものであること(正規性) 各群の母分散が等しいこと(等分散性) したがって,t検定の実施に先立って,これらの仮定が成り立つかどうかを判断しなければならない。 そのために,正規性と等分散性について,それぞれ異なる検定を行う必要がある。 正規性の検定 2群のデータの分布が,正規分布に従うかどうかを検定する。 この目的には,Kolmogorov-Smirnov(コロモゴロフ・スミノフ)検定がよく用いられる。 Rでは,この頭文字をとって ks.test() という名前の関数が用意されている。 この検定の帰無仮説は「あるデータが,正規分布をなす」である。 したがって,P値が大きければ,正規分布であると判断できる。 > ks.test(x$A,"pnorm",mean=mean(x$A),sd

  • ポアソン分布

    「ランダムに事象が起きる」という考え方 次の図は1200秒間に初代ポケットガイガー(PINフォトダイオードを使った放射線計)が放射線をカウントした時刻を示したものです。下は机の上にそのまま置いた場合(全部で17カウント),上はやさしお(カリウムを多く含む塩)の上に置いた場合(全部で38カウント)です。 par(mgp=c(2,0.8,0)) plot(c(0,1200), c(0,3), type="n", axes=FALSE, xlab="", ylab="") axis(1) x1 = c(55,81.5,178.1,194.4,214.3,254.3,517.8,548.7, 553.6,556.6,700.1,730.7,735.6,881.9,883.3,962.2,1164.2) x2 = c(43.9,54.8,85,94.3,115.2,224.5,228.5,246.1

  • Incanter: Statistical Computing and Graphics Environment for Clojure

    Incanter is a Clojure-based, R-like platform for statistical computing and graphics. Incanter can be used as a standalone, interactive data analysis environment or embedded within other analytics systems as a modular suite of libraries. Features Charting & visualization functions Mathematical functions Statistical functions Matrix & linear algebra functions Data manipulation functions Interactive,

    Hash
    Hash 2012/12/12
    S式で統計解析だと....!?
  • Shinyで5分でできる株価チャートウェブアプリ - はやしのブログ Rev.3

    RにもWeb化の波が来てますね。 RStudio, IncがリリースしたShinyはRのみでサーバーも他言語も必要とせずウェブアプリを作成できる画期的なパッケージです。 Introducing Shiny: Easy web applications in R - rstudio.com/shiny/ #rstats #rstudio #shiny— RStudioさん (@rstudioapp) 11月 8, 2012 概要はバタデ先生にお任せするとして,簡単なアプリを作ってみました。 ウェブアプリのスクリプトは,2つのファイルに分けて作成します。 1つめは,ui.Rという名前で作成します。 2つめは,server.Rという名前で作成します。 これらを1つのフォルダに保存します。ここではstockというフォルダを作って,そこに保存することにします。保存したら,Rを立ち上げ,stockのあ

    Shinyで5分でできる株価チャートウェブアプリ - はやしのブログ Rev.3
    Hash
    Hash 2012/11/11
    なにこれすごい