読んだ Nat Genet. 2016 Aug 1. 様々なデータを取ってきて、遺伝子との相関があるかを解析するわけだが、サンプルの人数、組織、遺伝子の3次元をサンプル×要素(component やfactor と呼ぶ)と要素×遺伝子の行列に分解することで、テンソル分解してデータの構造をいじる。 もちろん、時間次元をいれて4次元テンソルとかN次元テンソルとかも発展版ができる。 遺伝子を扱うときは、たいてい、遺伝子発現データが数万で、サンプルが100から1000といういわゆるp>>n 問題に直面する。そのため、spike-and-slabという方法で変数を減らしている。 個の変数がモデルにあるとする。はと同じ長さで、である。0ならばモデルにパラメータを取り入れず、1なら採用する、というフラグである。が採用される確率は、特に理由がなければベルヌーイ分布を使う。 モデルは普通にパラメータに対して
![Spike-and-slab - 驚異のアニヲタ社会復帰の予備](https://cdn-ak-scissors.b.st-hatena.com/image/square/0025b98c2aa949c0763b9544e9db34e4ad60d5ba/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.d.st-hatena.com%2Fdiary%2FMikuHatsune%2F2016-08-03.png)