近年,細菌の検出数を示す16S rRNAデータを用いて, 疾患等の臨床アウトカムと関連する菌種を 特定する統計解析が広く行われるようになった. それに対応して解析手法も多く提案されるようになり, 解析手法の一つとして潜在ディリクレ配分モデル(LDA)が用いられている. 教師情報を利用したLDAとして, 教師ありトピックモデル(SLDA)やディリクレ多項回帰モデルを 伴うLDA(DMR)が提案されている一方で, それら手法は細菌データに対して応用されていないとともに, 一定の割合を持つトピックが抽出されないことが多くある. これら問題に対処するため,本研究ではDMRを 拡張したノンパラメトリックベイズトピックモデルを提案し, 既存のDMRやSLDAと予測性能を比較評価した. ノンパラメトリックベイズモデルでは, 潜在変数について無限の値を仮定し, 各潜在クラスが占める割合に傾斜性を 持たせる
2020年9月7日現在、GitHub版ではofficer関連の対応がされたようだ。 niszetさん(id:niszet)から、コメントで教えていただいた。 GitHub上のexportパッケージをインストールしてコードを一式流してみたのですが、現時点(2020/Sep/06)では一通りコードが動くことを確認しました。 table2*** 関数の内部で使用している、flextableパッケージ起因の警告が出ていますが、それ以外は期待した動作をしていると思います。 また、broom::tidy(iris3)も警告は出ますが値が表示されるようです。 rglがpngのみサポートしている、は状況変わらずです(rglパッケージ自身がpngのみ対応している) セットアップ パワポにする 描画オブジェクトを Microsoft PowerPointにエクスポート スライドの追加 データフレームをPowe
観察データを用いた因果推論のための分析手法として非常に人気の「傾向スコア(Propensity Score)」法。 「傾向スコアを用いた分析」と言っても、マッチングや重み付けなどその使い方は様々あります。 巷にある因果推論に関する書籍では、傾向スコアを”どうやって使うのか”という視点で各手法の紹介がされていることが多いですよね。 ところが実際にマッチングや重み付けをしてみると、傾向スコアの使い方によって結果が大きく異なることも少なくありません。 このとき、「どちらの手法から得た答えが正しいのか?」と疑問に思うのは自然です。 それに傾向スコアの使い方はたくさんあるので、「そもそも結局どの使い方が一番いいの?」と思う人も多いでしょう。 この記事を読み終わるころには、「そもそもベストな傾向スコアの使い方、正しい使い方はない」ということがわかると思います。 ・傾向スコアという考え方の導入 ・傾向ス
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く