タグ

algorithmとbioinformaticsに関するxiangzeのブックマーク (2)

  • Nonnegative matrix factorization(NMF)でconsensus clustering

    NMFを追っかけてたらMetagenes and molecular pattern discovery using matrix factorizationという論文を見つけたので、週末はこの論文を読みながら色々やってみた。NMFの便利なところは元の特徴(この論文の場合は遺伝子発現量)からより少ない任意の特徴量(論文中ではmetagene)に変換できるところであり、さらにそのままクラスターの分割に利用できる。 たとえば2つのmetageneで表現した場合、より発現量の大きいmetageneで分割すれば2つのクラスに分けられる。(QSARだったらdescriptorからmeta discriptorが導かれてそれに基づいてクラス分類ができるでしょう) 続いて、重要なのがクラスの安定性である。要するに最適なクラスタの数はいくつなのかということである。これに対して、この論文ではConsensu

    Nonnegative matrix factorization(NMF)でconsensus clustering
  • Needleman-Wunsch algorithmを実装した - 西尾泰和のはてなダイアリー

    前に86チャットで誰かがdiffを作ろうとしていて、長さ N, M の文字列に対して素朴に N * M の配列を確保していたせいで大きなサイズの入力でメモリをい過ぎて破綻していたときに「動的計画法で端から埋めていくんだから、直前の1列だけ取っておくだけでいいでしょ」「いや、後でパスを求めないと行けないから全部持つ必要があるんだ!」「ないよ!パスの根元だけ参照で持っておけばいらないパスはGCで消えるでしょ!」という話をしたんだが、今ちょっと自分でも必要になったので作ってみた。うん、思った通りに動くな。 テストケースに書いてあるけど、実行すると下のような入出力になる。 >>> test("1", "001") in1: 1 in2: 001 (((), (0, 2)), 'D') out1: --1 out2: 001 >>> test("1", "100") in1: 1 in2: 100

    Needleman-Wunsch algorithmを実装した - 西尾泰和のはてなダイアリー
  • 1