タグ

ブックマーク / kazumaxneo.hatenablog.com (5)

  • GTFとGFFフォーマット - macでインフォマティクス

    2019 10/15追記 2020 10/13 リンク削除 GTF(General Transfer Format))はgeneのアノテーション専用のフォーマットと定義されている。それに対してGFF(General Feature Format)はtranscriptなどにも使えるよりジェネラルなフォーマットとなっている。この違いのため、例えばUCSC genomeではgeneアノテーションファイルはgtfフォーマットでのみダウンロード可能になっている。 GFFはバージョンにも注意する。GFF3はGFFのバージョン3を意味する。GFF2とGFF3には相違がある。GFF2はGTFと同じである。 フォーマットの説明; GTF、GFF3いずれも9のカラムからなるが、1〜8行目はGTFとGFFで同じのため、GTFを例に1-8行目を説明する。例えば以下はUCSCのgenomeデータベースからダウンロ

    GTFとGFFフォーマット - macでインフォマティクス
  • 複雑なデータをヒートマップで可視化するためのRパッケージ Superheat - macでインフォマティクス

    2021 08/11  データのロード追記 テクノロジーの進歩により、科学分野をはじめとする膨大な量のデータを収集することが可能になった。従来のデータ可視化ツールは、高次元環境ではうまく機能しないため、このような膨大なデータセットから有用な情報を抽出することは、継続的な課題となっている。既存の可視化技術の中で、特に大規模データの可視化に適しているのがヒートマップである。ヒートマップは、バイオインフォマティクスなどの分野で非常に人気があるが、現代のデータ解析においてはまだ十分に活用されていない。論文では,複雑なデータセットを可視化するための極めて柔軟でカスタマイズ可能なプラットフォームを提供する新しいRパッケージであるsuperheatを紹介する。Superheatは、魅力的で拡張可能なヒートマップを作成し、ユーザーは応答変数を散布図として、モデル結果を箱ひげ図として、相関情報を棒ひげ図と

    複雑なデータをヒートマップで可視化するためのRパッケージ Superheat - macでインフォマティクス
  • メタゲノムのアセンブリ配列からファージやプラスミドを予測する PPR-Meta - macでインフォマティクス

    Mobile genetic elements(MGE)として知られるファージとプラスミドは、原核生物や真核生物の間で遺伝情報を交換するとともに、水平遺伝子伝達(HGT)の主要な参加者である[ref.1]。そのようなエレメントは、宿主と相互作用することによって微生物群集を調節することができる。 MGEの重要な役割の1つは、耐性遺伝子をバクテリア間に分散させ、微生物群集間の環境適応を促進する能力である。ほとんどの場合、かなりの数のファージおよびプラスミドゲノムが微生物界に存在する。例えば、海洋ファージの存在量は海洋システム内の他の生物の存在量を凌駕し、海洋システムから分離された細菌の半分以上が1以上のプラスミドを含んでいることが報告されている[ref.3、4]。したがって、メタゲノム中のファージおよびプラスミドフラグメントの同定は、HGTおよびMGEと宿主との間の相互作用の包括的な分析におけ

    メタゲノムのアセンブリ配列からファージやプラスミドを予測する PPR-Meta - macでインフォマティクス
  • データに適した視覚化フォーマットにナビゲートし、その描画コードを教えてくれる From Data to Viz - macでインフォマティクス

    2020 3/3  タイトル修正 From Data to Vizは、決定木(wiki)を使ってデータの可視化に適したフォーマットを教えてくれるwebサイト。 From data to Viz | Find the graphic you need 下記の決定木を使い、自分の所有しているデータタイプに適したフォーマットを絞り込む。 ここではカテゴリーを数値変数とする。 数値変数(Numerical variable)が1つだけあるなら左端のルートになる。 少し下にスクロールする。histgramとdensity plotのアイコンがある。下のStoryをクリックすると、histgramとdensity plotの説明が得られる。 histgramのアイコンをクリックする。ポップアップしたウィンドウには特徴や注意事項などがまとめられている。 Rとpythonのコードのリンクがあるが、ここでは

    データに適した視覚化フォーマットにナビゲートし、その描画コードを教えてくれる From Data to Viz - macでインフォマティクス
  • クレード特異的マーカー遺伝子を使いメタゲノム配列のtaxnomy assigmentを行う MetaPhlAn2、クラスタリングするHclust2、系統樹を作成するGraPhlAn - macでインフォマティクス

    2019 5/17 condaインストール追記、イントロ文章修正、 2019 7/2タイトル修正 2019 7/4 インストール追記 2019 7/6 インストール追記タイトル修正、誤解を招く文章を削除 2019 10/8 インストール追記 2020 8/24 condaインストール追記 2021 7/16 mambaに変更 MetaPhlAnは、メタゲノムショットガンシーケンスデータから微生物群集の構成をプロファイリングするための計算ツールである。 MetaPhlAnは、〜17,000のリファレンスゲノム(〜13,500の細菌および古細菌、〜3,500のウイルス、〜110の真核生物)から同定された独自のクレード特異的マーカー遺伝子に依存している。 1秒間に最大25,000回のリード(1つのCPU上)の分析速度(既存の方法と比較して桁違いに速い)。 MetaPhlAnマーカーとしての明確な

    クレード特異的マーカー遺伝子を使いメタゲノム配列のtaxnomy assigmentを行う MetaPhlAn2、クラスタリングするHclust2、系統樹を作成するGraPhlAn - macでインフォマティクス
  • 1