サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
大谷翔平
jojoshin.hatenablog.com
今日はリストを比較する時に役にたつコマンドを紹介します。 これらは膨大なリストを扱う際に、「共通のものを抽出する」「片方に特有のものを抽出する」などに非常に役に立ちます。 早速、実践 下記のようにAとBのリストが与えられているとする。 #AとBそれぞれ4つと3つのSNPのリストがあるとする。 A <- c("rs1", "rs2", "rs3", "rs4") B <- c("rs2", "rs4", "rs5") 両方にふくまれている文字列を抽出する(Aにもあって、Bにもある) Int <- intersect(A, B) Int # "rs2" "rs4" Aのみにふくまれている文字列を抽出する(Aにあって、Bにない) difA <- setdiff(A, B) difA # [1] "rs1" "rs3" Bのみにふくまれている文字列を抽出する(Bにあって、Aにない) difB <-
今回は、リッジ回帰によって多重共線性の問題を回避できることを簡単にまとめておきます(わかりやすくまとめたつもりです)。 先日(4/28)の記事で紹介した『リッジ回帰を用いた異常検知』で、「リッジ回帰は、多重共線性の問題を回避できる」という性質について 学習しました。それってどういうことなのか、簡単に整理しておきたいと思います。 jojoshin.hatenablog.com 1. 多重共線性とは(multicolinearity) 多重共線性とは、モデル内の独立変数が他の独立変数と相関しているときに起こる状態です。このように関連がある変数同士がモデルに含まれると、推定値の計算が不安定になることが知られています。 2. 多重共線性の問題って実際のところ何? そもそも最小二乗法の解はこのように表すことができます。 ただし、多重共線性がある場合には、 の計算が難しくなる。これを説明するために今回
今回は、遺伝疫学でも近年注目されているmendelian randomization(以下:MR)について、情報を集約し簡単なまとめをしておきます。 MRは、経済学や社会調査の解析において利用されてきた操作変数(instrumental variable)を導入した解析方法の一種であります。これまでに特に学習する機会もなかったのですが、GWASなどの結果が蓄積され、疫学の国際学会や遺伝疫学分野の研究者ミーティングでも頻繁に目にするようになったので、今回整理したいと思います。(もとになる論文は2003年に報告されています [Davey Smith G (2003) Int J Epidemiol.] MRの大きなメリットとして、観察研究データで因果関係を考察できる点ですが、その詳しい内容を下記にまとめていきます。 1. 観察研究の限界とMR 医学研究における一つの関心事は、「何らかのリスク要
クイズ:これ何を意味している図でしょう? どうもこんばんは。みなさん冒頭の棒グラフとその横のデータの分布を示した図の意味は分かったでしょうか。結論から言えば、右のようにデータの分布が異なっても、実は同じ棒グラフになるという事例でした。 (もちろん、表の真下にある検定結果も異なっています。これは恐ろしい問題ですね。) というわけで、今回は珍しく、論文紹介をしたいと思います。きっかけは友達とスタバで「データの要約や図示」について話してたことで、この論文の存在を思い出し、何言ってたかなーときちんと整理しようと思いました。 今回紹介する論文は Beyond Bar and Line Graphs: Time for a New Data Presentation Paradigm (Weissgerber TL, et al. PLOS BIOLOGY (2015))です。 イントロ まず、この論
今回は、欠損値の発生する理由を紹介し、その後に書籍を参考に欠損値に対応するRのコードを紹介します。 医学研究だけでなく、様々な調査をしていると欠損値(missing value)に出会います。欠損値が発生しているメカニズムによっては、結果を大きく変える可能性もあります。そのため、まずは欠損値のメカニズムを把握すること、その後欠損値に対応することになります。 欠損値が発生する理由 MCAR (Missing completely at random)「完全にランダムな欠損値」 MAR (Missing at random)「欠損値と他の変数には関連があるが、その変数の値自体との関連はない」 MNAR (Missing not at random)「欠損値とその変数自体に関連がある」 欠損値のパターンとその対象法など詳しく書かれています。 norimune.net 欠損値への対処方法 「Use
このページを最初にブックマークしてみませんか?
『統計学と疫学と時々、助教生活』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く