サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
WWDC25
labo-code.com
この記事ではAlphafold Analysisを利用した立体構造予測結果の分析を扱います。この記事を理解することでAlphafoldやlocalcolabfoldなどの立体構造予測モデルを定量的に解析できます。 動作検証済み環境 macOS Montery(12.4), python3.7.10, Jupyter Notebook 自宅でできるin silico創薬の技術書を販売中 新薬探索を試したい方必読! ITエンジニアである著者の視点から、wetな研究者からもdryの創薬研究をわかりやすく身近に感じられるように解説しています 技術書ページへ 自宅でできるin silico創薬の技術書を販売中 分子ドッキングやMDシミュレーションなど、 自宅でできるin silico創薬の解析方法を解説したものになります! 技術書ページへ 自宅でできるin silico創薬の技術書を販売中 in s
機械学習ポテンシャル(MLポテンシャル)を使って、DFT 並みの精度を保ちつつ 100~10,000 倍高速に分子構造最適化を行う方法を解説する記事です。Google Colab 上で水分子やエタノールの最適化結果をエネルギーや結合長の収束グラフで可視化します。学ぶと、ブラウザだけで手軽に高精度・高速な分子シミュレーションを試せるようになり、試行錯誤のサイクルが飛躍的に短縮することができます! 動作検証済み環境 Google Colab (2025-05-26), Python 3.10, Torch 2.3.0+cu118, TorchANI 2.2.4, ASE 3.22.1, Matplotlib 3.7.1 PySCFを使った無料で始められる量子化学計算の技術書を販売中 PySCFを使い構造最適化や振動数計算、物性解析など高度な量子化学計算ができます! 技術書ページへ Gaussi
GSEA解析に挑戦してみたいと思いませんか? GSEA解析で遺伝子セットエンリッチメント解析できれば、RNA-seq解析の幅がかなり広がります。ぜひ挑戦してみましょう。 公共データを用いたRNA-seq解析に関する初心者向け技術書を販売中 画面キャプチャをふんだんに掲載したわかりやすい解説! 自宅PCからドライ研究が始められます 技術書ページへ 公共データを用いたSingle Cell RNA-seq解析に関する初心者向け技術書を販売中 プログラミング初心者でも始められるわかりやすい解説! RとSeuratで始めるSingle Cell RNA-seq解析! 技術書ページへ 公共データを用いたシングルセル ダイナミクス解析に関する初心者向け技術書を販売中 シングルセルデータの高度な解析であるTrajectory解析、RNA Velocity解析、空間トランスクリプトーム解析が環境構築方法か
今回は、発現変動解析(DEG解析)の結果を視覚的に理解するための「可視化手法」 に焦点を当てて解説します。RNA-seq解析で得られる膨大な結果をわかりやすく表現するには、MAプロット、火山プロット、ヒートマップといったグラフの活用が不可欠です。この記事では、DESeq2による解析結果をもとに、RとBioconductorのパッケージを用いた実践的な可視化手法を、コードと解説付きで紹介します。 「結果をどう見せるか?」で、発見の質が大きく変わります。これを機に、可視化にも強いRNA-seq解析者を目指しましょう。 動作検証済み環境 macOS Monterey (12.4), Quad-Core Intel Core i7, Memory 32GB公共データを用いたRNA-seq解析に関する初心者向け技術書を販売中 画面キャプチャをふんだんに掲載したわかりやすい解説! 自宅PCからドライ研
本記事は抗体のアミノ酸配列から構造、各部位のアノテーションや分子特性などを予測するソフトウェアSAbPredの中のnanobodyのモデリングを行うNanobodyBuilder2の使い方を紹介します。webブラウザ上からノーコードかつ個人情報の登録の必要が無く解析できるため、どなたでも気軽に試すことができます。この記事では実施例をお見せしながら紹介します。 本記事は現役博士課程の後藤大和さん協力のもと執筆されました。ご協力誠にありがとうございます! 動作検証済み環境 Mac M2, Sequoia 15.3.1 自宅でできるin silico創薬の技術書を販売中 新薬探索を試したい方必読! ITエンジニアである著者の視点から、wetな研究者からもdryの創薬研究をわかりやすく身近に感じられるように解説しています 技術書ページへ 自宅でできるin silico創薬の技術書を販売中 分子ドッ
本記事は抗体のアミノ酸配列から構造、各部位のアノテーションや分子特性などを予測するソフトウェアSAbPredの中の抗体のモデリングを行うABodyBuilder2の使い方を紹介します。webブラウザ上からノーコードかつ個人情報の登録の必要が無く解析できるため、どなたでも気軽に試すことができます。この記事では実施例をお見せしながら紹介します。 本記事は現役博士課程の後藤大和さん協力のもと執筆されました。ご協力誠にありがとうございます! 動作検証済み環境 Mac M2, Sequoia 15.3.1 自宅でできるin silico創薬の技術書を販売中 新薬探索を試したい方必読! ITエンジニアである著者の視点から、wetな研究者からもdryの創薬研究をわかりやすく身近に感じられるように解説しています 技術書ページへ 自宅でできるin silico創薬の技術書を販売中 分子ドッキングやMDシミュ
この記事では、タンパク質デザインのソフトウェアの一つであるOSPREY について紹介します。 OSPREY の環境構築と、その簡単な使用方法で、特定の残基を変更させ、どの組み合わせが最も安定な構造かを発見します。環境構築から丁寧に書いているので、ぜひお試しください。 動作検証済み環境 Mac M1, Sequoia 15.3, Python 3.10.0 自宅でできるin silico創薬の技術書を販売中 新薬探索を試したい方必読! ITエンジニアである著者の視点から、wetな研究者からもdryの創薬研究をわかりやすく身近に感じられるように解説しています 技術書ページへ 自宅でできるin silico創薬の技術書を販売中 分子ドッキングやMDシミュレーションなど、 自宅でできるin silico創薬の解析方法を解説したものになります! 技術書ページへ 自宅でできるin silico創薬の技
本記事はタンパク質の情報(アミノ酸配列や立体構造)からその物性を予測するソフトウェアProtein-Solの使い方の後編記事になります(前編はこちら)。今回は抗体の物性の予測を行うAbpredというアプリケーションについて、本記事での実施例をお見せしながら、使い方をご紹介します。 本記事は現役博士課程の後藤大和さん協力のもと執筆されました。ご協力誠にありがとうございます!
PoseViewとは? 創薬研究において、タンパク質と化合物の相互作用を視覚的に把握することは、結合メカニズムの理解やリガンド最適化に極めて重要です。 PoseViewは、ドイツのハンブルク大学が提供しているタンパク質−リガンド複合体の相互作用を自動で2D図に変換する可視化ツールです。 主な特徴: PDBファイルから結合ポーズ(Pose)を2Dスキームに変換 水素結合、疎水性相互作用、π−πスタッキング、カチオン−π相互作用などを識別 Webベースで使える(インストール不要) PDFまたはSVG形式で出力可能 すでに以下のような論文にも使用されています。 In Silico and in Vitro Study of Trace Amines (TA) and Dopamine (DOP) Interaction with Human Alpha 1-Adrenergic Receptor
0. 量子化学計算用のソフトウェア: PySCFとは PySCFの参考文献から引用 PySCF(Python Simulations of Chemistry Framework)は、Pythonベースのオープンソースの量子化学計算フレームワークです。PySCFは、高度な電子構造計算をシンプルかつ効率的に実行するためのツールを提供し、研究者や学生が量子化学の計算を容易に行えるように設計されています。 PySCFの主な特徴は以下の通りです: モジュラー設計:PySCFは、計算の各ステップ(分子の構造定義、基底状態の計算、励起状態の計算など)をモジュールとして提供しており、必要な部分だけを組み合わせて使用することができます。 高性能計算:内部に高度なアルゴリズムを使用しており、大規模な計算でも高速に処理を行うことができます。 柔軟性:Pythonで記述されているため、カスタマイズや他のPyth
edgeRによる発現変動解析 edgeRはRNA-seqデータから差次的発現遺伝子(DEG)を同定するための効率的なツールです。DESeq2と同様にネガティブバイノミアル分布を使用しますが、異なる正規化手法と統計的アプローチを採用しています。edgeRの主な特徴は以下の通りです: TMM(Trimmed Mean of M-values)法による効果的なサンプル間の正規化 タグワイズ分散推定による遺伝子ごとの生物学的変動の正確な評価 少ないサンプル数でも信頼性の高い結果を得るための経験ベイズ法 一般化線形モデル(GLM)を用いた複雑な実験デザインへの対応 正確検定(exact test)やQLF検定など、状況に応じた統計的検定手法 計算効率の良いアルゴリズムによる大規模データセットの迅速な処理 この記事では、edgeRを使用して発現変動遺伝子を特定し、様々な手法による結果の違いや解釈方法に
本記事はタンパク質の情報(アミノ酸配列や立体構造)からその物性を予測するソフトウェアProtein-Solの使い方を紹介します。今回紹介するProtein-Solはwebブラウザ上からノーコードかつ個人情報の登録の必要が無く解析でき、本記事では実施例をお見せしながら、ご紹介します。 本記事は現役博士課程の後藤大和さん協力のもと執筆されました。ご協力誠にありがとうございます!
解析準備 GEOからカウントデータを取得 今回の解析に使うカウントデータを取得してください。 # GEOqueryパッケージを読み込む library(GEOquery) # GEOからカウントデータを取得 gse <- getGEO("GSE141413", GSEMatrix = FALSE) # カウントデータを含む補足ファイルをダウンロード supp_dir <- "data/geo_suppl" dir.create(supp_dir, recursive = TRUE, showWarnings = FALSE) count_file <- getGEOSuppFiles("GSE141413", baseDir = supp_dir, makeDirectory = FALSE) # ダウンロードしたカウントデータを読み込む counts_path <- file.path(
分子動力学シミュレーション(MDシミュレーション)は、分子の動きや相互作用を計算機上で再現する手法です。分子の構造と相互作用を記述する力場(potential function)を使用し、時間の経過とともに分子の運動を予測します。これにより、物質の性質や相互作用の理解、材料設計、生体分子の研究などに応用されます。 GROMACSは、MDシミュレーションを実行するためのソフトウェアの一つです。GROMACSは高性能な計算を行うための最適化が施されており、広く使われている信頼性の高いツールです。GROMACSを使うことで、分子のダイナミクスや相互作用をシミュレーションすることができます。 この記事では実際にGROMACSを使って、自分のパソコンでMD シミュレーションを行ない、タンパク質が安定化した構造をPDBファイルとして保存します。 GROMACSの環境構築(Homebrew) GROMA
GEOデータベースとは Gene Expression Omnibus(GEO)は、米国国立生物工学情報センター(NCBI)が運営する公共データベースであり、遺伝子発現データや関連する生物学的データの保存と提供を行っています。GEOは、マイクロアレイ、RNA-Seq、ChIP-Seqなど、さまざまな高スループット実験技術によって得られた遺伝子発現プロファイルを収集・保存しています。 GEOを使えばほしいRNA-seqデータを探すことができるのでやってみましょう。 ブラウザからGEOを使って好きなキーワードでRNA-seqデータを探す方法 GEOのトップページの右の検索バーに探したいキーワードで探します。今回は試しに「lung cancer」と打ち込んでください。 すると、検索バーのすぐ下にresultsが出てきます。GEO DataSets Databaseの方をつかいたいため、上の方の数
1. PLIPとは? PLIPは、PDBフォーマットのタンパク質-リガンド複合体から相互作用を自動検出するツールです。以下のような相互作用を解析できます。 水素結合 (Hydrogen Bonding) 疎水性相互作用 (Hydrophobic Interactions) 塩橋 (Salt Bridges) π-スタッキング (π-Stacking) 金属配位結合 (Metal Coordination) ハロゲン結合 (Halogen Bonds) PLIPは Pythonベース で動作し、コマンドラインまたはWebインターフェースで利用可能です。ブラウザで簡単にやりたい方はこちら。 以下のような論文に実際に使われているツールですので、本記事で出てきた図をそのまま掲載することも可能です。 Identification of Novel Ribonucleotide Reductase I
Smina とは? インシリコスクリーニングは、数千~数百万の化合物ライブラリを仮想的に試し、ターゲットタンパク質に最も強く結合する候補を探す手法です。代表的なツールとして AutoDock Vina がありますが、 Smina はその改良版です。 AutoDock Vina は 高速かつ使いやすい ドッキングツールで、スコアリング関数は固定ですが、並列処理により効率的なスクリーニングが可能です。一方、Smina は スコアリング関数を変更できる ため、AutoDock4(AD4)やカスタム関数を用いた評価が可能です。また、Smina では --score_only 機能により、ドッキングせずに 結合エネルギーを計算するだけ の処理ができ、大規模スクリーニングの高速化に適しています。さらに、--autobox_ligand を利用すると、リガンドサイズに基づいて自動的にグリッドボックスを設
環境構築 まず、RDKitを使用するための仮想環境を作成し、必要なライブラリをインストールします。 1. Minicondaのインストール(未インストールの場合) RDKitはcondaを用いてインストールするのが便利です。そのため、まずMinicondaをインストールしてください。 (下はintelチップのものを使っています。) (intelチップの用) curl -O <https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-x86_64.sh> bash Miniconda3-latest-MacOSX-x86_64.sh (M1/M2/M3 Mac用 ARM64版) curl -O <https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.
BigQueryでのGIS活用 BigQueryでは、地理データを分析するために 空間関係関数(Spatial Predicate Functions) を提供しています。GEOGRAPHY型では通常の = 演算子による等価比較は定義されておらず、地理オブジェクト同士の関係を判定するために、専用の述語関数を使用します。 述語関数は、2つの地理オブジェクト間の空間的な関係(例えば、「包含しているか」「交差しているか」「一定距離以内にあるか」など)を評価し、TRUE または FALSE を返します。これらを WHERE 句や AND・OR 条件と組み合わせることで、柔軟な空間フィルタリングが可能になります。 また、地理データの操作・変換には 変換関数 が用いられます。これは述語関数が返す関係に対応する形で、新たなジオメトリを生成する機能を提供します。また、エリアの拡張(ST_BUFFER)、重
量子化学計算用のソフトウェア: PySCFとは 参考文献[1]から引用 PySCF(Python Simulations of Chemistry Framework)は、Pythonベースのオープンソースの量子化学計算フレームワークです。PySCFは、高度な電子構造計算をシンプルかつ効率的に実行するためのツールを提供し、研究者や学生が量子化学の計算を容易に行えるように設計されています。 PySCFの主な特徴は以下の通りです: モジュラー設計:PySCFは、計算の各ステップ(分子の構造定義、基底状態の計算、励起状態の計算など)をモジュールとして提供しており、必要な部分だけを組み合わせて使用することができます。 高性能計算:内部に高度なアルゴリズムを使用しており、大規模な計算でも高速に処理を行うことができます。 柔軟性: Pythonベースであるため、スクリプトを通じて簡単に操作や拡張が可能
Homology Modelingとは? Homology modeling(ホモロジーモデリング) は、既存のタンパク質構造(テンプレート)を使って、類似したタンパク質の3D構造を予測する方法 です。 手順は以下の通りになります。今回は4まで行います。 ターゲットタンパク質のアミノ酸配列を用意 既存の構造データ(PDBなど)から類似したテンプレートを探す テンプレートを基に3Dモデルを作成 モデルの品質を評価(GMQE, QMEANなど) 必要に応じて修正や最適化(エネルギー最小化やMDシミュレーション) SWISS-MODELとは? SWISS-MODEL は、ホモロジーモデリングを自動で行うオンラインツール です。 アミノ酸配列を入力するだけで、最適なテンプレートを選び、3Dモデルを生成してくれる ため、初心者でも使いやすいのが特徴です。 以下のリンクにあるタンパク質BRAFを参照し
Network Pharmacologyとは ネットワーク薬理学は、システムバイオロジーと計算科学を活用し、薬物が生体内の複数の標的や経路にどう作用するかを解析する分野です。従来の「1薬1標的」モデルではなく、「1薬多標的」アプローチを採用し、薬の効果や副作用を包括的に理解します。疾患関連遺伝子ネットワーク、薬物標的ネットワーク、シグナル伝達経路解析などを組み合わせ、副作用の予測やドラッグリポジショニング(既存薬の新たな適応症探索)を支援します。個別化医療にも応用され、患者ごとの遺伝子情報に基づいた最適な治療法の開発にも貢献しています。 Drug–Gene Interaction Network(薬物–遺伝子相互作用ネットワーク)とは? Drug–Gene Interaction Networkは、薬物と標的遺伝子の相互作用を解析し、薬の作用機序や副作用の予測に活用するネットワークモデルで
比較のポイント 商業的化合物を探したい場合 → ZINC15 購入可能な化合物が対象で、in silico創薬のスクリーニングに最適。 幅広い化学データを扱いたい場合 → PubChem 医薬品だけでなく、あらゆる化学物質をカバー。APIを利用した大規模データ解析にも向いている。 創薬のためのデータが欲しい場合 → ChEMBL 生物活性データとターゲット情報が豊富で、ドラッグデザインや標的探索に最適。 天然物のスクリーニングをしたい場合 → COCONUT 天然物に特化し、化合物の起源情報も確認できる。 より詳しくそれぞれを見ていきます。 主要なライブラリ ZINC15 ZINC15は、商業的に入手可能な化合物を中心に、数千万の化合物を収録した無料のデータベースです。研究者は、特定の物理化学的特性や構造に基づいて化合物を検索・ダウンロードできます。 ライブラリの入手の仕方 1. まずはこ
宣伝 こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます! 【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。 本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーションに関わる部分のツールの一部を紹介しています。プロジェクトの詳細については、iGEM-Wasedaの成果報告サイトをご覧いただければ幸いです。 MACEとは MACEは、機械学習ポテンシャル(Machine Learning Potential)の一種として開発されたツールで、材料内の原子間相互作用を高精度かつ高速に予測できるの
時系列分解の意義 多くの実世界のデータは、時間的な変化を伴った時系列データとして記録されます。需要予測、気象予報、株価分析など、時系列データを分析する分野は多岐にわたります。 時系列データは大抵以下のような構造が含まれています。 トレンド(Trend) : 長期的に増減する動き 季節成分(Seasonality) : 1年や1か月など一定の周期で繰り返す変動 残差(Residual) : 不規則な変動やノイズなど これらの成分を分解して扱えると、データの理解が格段に進み、将来予測や異常検知に応用する際にも有利になります。 伝統的な時系列分解モデル 加法モデル(Additive Model) 古典的な加法モデルによる時系列分解では、時系列 $y_t$ を以下のように表します。 $y_t = T_t + S_t + R_t$ $y_t$: 観測値 (Observed series) $T_t$
前回の記事で、scVeloを用いたRNA Velocity解析の基本を学びました。しかしながら、NCBI SRAなどの公共データベースのfastqファイルからどのようにRNA Velocity解析をやるのかイメージがつきづらいかと思います。この記事では、cellrangerから出力されたBAMファイルをvelocytoに読み込ませてloomファイルを作成して、RNA Velocity解析するためのファイルを準備する方法を学びます。 これによって好きな公共のシングルセルデータを使ってRNA Velocity解析ができるようになります。ぜひ学んでいきましょう。
10x Genomics Cell Rangerのデータを読み込むには? 結論からいうと、10x Genomics Cell Ranger pipelineのデータを読み込むにはmonocle3のload_cellranger_data()を使います。公式サイトでも言及されています。 https://cole-trapnell-lab.github.io/monocle3/docs/getting_started/#10x-output # Provide the path to the Cell Ranger output. cds <- load_cellranger_data("~/Downloads/10x_data") 注記: load_cellranger_dataは、umi_cutoffという引数を取ります。これは、セルに含まれるべきリード数を決定するものです。デフォルトでは
Trajectory解析とは? Trajectory解析(軌跡解析、軌道解析とも呼ばれる)は、シングルセルRNAシーケンス(scRNA-seq)データの解析において、細胞が時間経過とともにどのように状態を変化させていくのか、その過程(軌跡)を推定する手法です。従来のバルクRNA-seqでは細胞集団の平均的な遺伝子発現しか見えませんでしたが、scRNA-seqによって個々の細胞のトランスクリプトームを捉えることができるようになり、Trajectory解析によって細胞の動的な変化をより詳細に理解することが可能になりました。 Hussein A et al., 2021 より引用 https://www.nature.com/articles/s41467-021-26282-z Trajectory解析は、以下のような疑問に答えるのに役立ちます。 幹細胞はどのような細胞に分化していくのか?その
RNA Velocity解析とは? RNA Velocity解析は、一言で言うと、個々の細胞がどのような状態に変化していくのか(分化や状態変化の方向と速度)を予測する技術です。従来のRNA-Seqは細胞のスナップショット(静的な情報)しか捉えられませんでしたが、RNA Velocityは細胞内のmRNAのスプライシング状態に着目することで、時間的な変化(動的な情報)を捉えることを可能にしました。 https://www.nature.com/articles/s41586-018-0414-6 Bergen V, et al. Generalizing RNA velocity to transient cell states through hidden time. Nat Biotechnol. 2020;38(12):1408-1414. より引用 RNA Velocity解析では、
次のページ
このページを最初にブックマークしてみませんか?
『トップページ - LabCode』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く