ゲノムをマッピングする(リシークエンス) HiSeqXやNovaSeqの登場でIllumina系の全ゲノムショットガンリシークエンス解析が安価になりました。さらに最近はIlluminaに並ぶショートリードシークエンサーであるDNBSEQも登場しています。 参照ゲノム配列に対して、新しい個体の全ゲノムショットガンシークエンスデータをマッピングし、バリアント解析をするのは必須の解析ですが、あまたある方法の中でも定番のひとつである、BWA(Burrows-Wheeler Alignment Tool)からのGATK(Genome Analysis Toolkit)を使ってマッピングするためのソースをまとめました。 Linux環境にインストールしておくべきソフト BWA Samtools GATK(v4を使います) Illuminaデータの前処理 Illuminaデータ(fastqファイル)の前処