タグ

ブックマーク / hoxo-m.hatenablog.com (4)

  • R で超簡単に並列処理を書けるパッケージ pforeach を作った - ほくそ笑む

    ※この記事は R Advent Calendar 2014 : ATND の 22 日目の記事です。 0. この記事の要約 R の foreach パッケージを改良して、デフォルトで並列計算するようにしたパッケージ pforeach を作りました。 pforeach - Easy to parallel processing in R これにより、R での並列計算を下記のようにシンプルに書くことができます。 library(pforeach) pforeach(i = 1:100)({ i ** 2 }) これは、従来の foreach で次のように書いたものと同じ動作をします。 library(foreach) library(doParallel) cl <- makeCluster(detectCores()) registerDoParallel(cl) foreach(i = 1

    R で超簡単に並列処理を書けるパッケージ pforeach を作った - ほくそ笑む
    blackshadow
    blackshadow 2015/10/25
    使ってみたい。今使ってるスクリプトで何か組み込めるの探してみよう。
  • マイナーだけど最強の統計的検定 Brunner-Munzel 検定 - ほくそ笑む

    対応のない 2 群間の量的検定手法として、最も有名なのは Student の t 検定でしょうか。 以前、Student の t 検定についての記事を書きました。 小標問題と t検定 - ほくそ笑む しかし、Student の t 検定は、等分散性を仮定しているため、不等分散の状況にも対応できるように、Welch の t 検定を使うのがセオリーとなっています。 ただし、これら 2つの検定は分布の正規性を仮定しているため、正規性が仮定できない状況では、Mann-Whitney の U検定というものが広く使われています。 Mann-Whitney の U検定は、正規性を仮定しないノンパラメトリック検定として有名ですが、不等分散の状況でうまく検定できないという問題があることはあまり知られていません。 今日は、これらの問題をすべて解決した、正規性も等分散性も仮定しない最強の検定、Brunner-

    マイナーだけど最強の統計的検定 Brunner-Munzel 検定 - ほくそ笑む
  • de Bruijn Graph を使った de novo アセンブリの発想がすごい件 - ほくそ笑む

    Velvet や ABySS などの代表的な de novo アセンブリツールでは、アルゴリズムに de Bruijn Graph というのを使っているそうです。どうやってアセンブルしているんだろう?と興味を持っていたので、元ネタの An Eulerian path approach to DNA fragment assembly を読んでみたんですが、その発想のすごさに度肝を抜かれました。せっかくなので、ここで簡単に説明してみたいと思います。 ケーニヒスベルクの橋 まずはグラフ理論の説明から。グラフ理論は、18世紀にオイラーという数学者が「ケーニヒスベルクの橋」という問題を解くために考え出したといわれています。 「ケーニヒスベルクの橋」は、次のような問題です。 18世紀の初めごろにプロイセン王国の首都であるケーニヒスベルクという大きな町があった。この町の中央には、プレーゲル川という大き

    de Bruijn Graph を使った de novo アセンブリの発想がすごい件 - ほくそ笑む
  • RNA-Seq とマイクロアレイでの変動遺伝子の比較方法について(1) - ほくそ笑む

    僕はバイオインフォマティクスの会社に勤めているんですけど、統計関係の仕事をしています*1。 なので、たまにバイオの人から統計関係の相談を持ちかけられることがあります。 今回、ちょっとおもしろいことを相談されて、頭を悩ませたので、ここで紹介しようと思います。 RNA-Seq v.s. マイクロアレイ 今回相談されたことというのは、RNA-Seq の解析結果とマイクロアレイの解析結果で、同じような結果が出たのかどうか知りたいが、どうすればいいか?というものでした。 もう少し詳しく言うと、同じ組織に対して RNA-Seq とマイクロアレイで発現変動を調査したところ、RNA-Seq で変動がみられた遺伝子が 4000 個、マイクロアレイで変動がみられた遺伝子が 1000 個、両方で共通して変動がみられた遺伝子が 300 個だったそうです。 このとき、300 個というのは多いのか少ないのか、RNA-

    RNA-Seq とマイクロアレイでの変動遺伝子の比較方法について(1) - ほくそ笑む
  • 1