サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
インタビュー
labo-code.com
Smina とは? インシリコスクリーニングは、数千~数百万の化合物ライブラリを仮想的に試し、ターゲットタンパク質に最も強く結合する候補を探す手法です。代表的なツールとして AutoDock Vina がありますが、 Smina はその改良版です。 AutoDock Vina は 高速かつ使いやすい ドッキングツールで、スコアリング関数は固定ですが、並列処理により効率的なスクリーニングが可能です。一方、Smina は スコアリング関数を変更できる ため、AutoDock4(AD4)やカスタム関数を用いた評価が可能です。また、Smina では --score_only 機能により、ドッキングせずに 結合エネルギーを計算するだけ の処理ができ、大規模スクリーニングの高速化に適しています。さらに、--autobox_ligand を利用すると、リガンドサイズに基づいて自動的にグリッドボックスを設
環境構築 まず、RDKitを使用するための仮想環境を作成し、必要なライブラリをインストールします。 1. Minicondaのインストール(未インストールの場合) RDKitはcondaを用いてインストールするのが便利です。そのため、まずMinicondaをインストールしてください。 (下はintelチップのものを使っています。) (intelチップの用) curl -O <https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-x86_64.sh> bash Miniconda3-latest-MacOSX-x86_64.sh (M1/M2/M3 Mac用 ARM64版) curl -O <https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.
BigQueryでのGIS活用 BigQueryでは、地理データを分析するために 空間関係関数(Spatial Predicate Functions) を提供しています。GEOGRAPHY型では通常の = 演算子による等価比較は定義されておらず、地理オブジェクト同士の関係を判定するために、専用の述語関数を使用します。 述語関数は、2つの地理オブジェクト間の空間的な関係(例えば、「包含しているか」「交差しているか」「一定距離以内にあるか」など)を評価し、TRUE または FALSE を返します。これらを WHERE 句や AND・OR 条件と組み合わせることで、柔軟な空間フィルタリングが可能になります。 また、地理データの操作・変換には 変換関数 が用いられます。これは述語関数が返す関係に対応する形で、新たなジオメトリを生成する機能を提供します。また、エリアの拡張(ST_BUFFER)、重
量子化学計算用のソフトウェア: PySCFとは 参考文献[1]から引用 PySCF(Python Simulations of Chemistry Framework)は、Pythonベースのオープンソースの量子化学計算フレームワークです。PySCFは、高度な電子構造計算をシンプルかつ効率的に実行するためのツールを提供し、研究者や学生が量子化学の計算を容易に行えるように設計されています。 PySCFの主な特徴は以下の通りです: モジュラー設計:PySCFは、計算の各ステップ(分子の構造定義、基底状態の計算、励起状態の計算など)をモジュールとして提供しており、必要な部分だけを組み合わせて使用することができます。 高性能計算:内部に高度なアルゴリズムを使用しており、大規模な計算でも高速に処理を行うことができます。 柔軟性: Pythonベースであるため、スクリプトを通じて簡単に操作や拡張が可能
Homology Modelingとは? Homology modeling(ホモロジーモデリング) は、既存のタンパク質構造(テンプレート)を使って、類似したタンパク質の3D構造を予測する方法 です。 手順は以下の通りになります。今回は4まで行います。 ターゲットタンパク質のアミノ酸配列を用意 既存の構造データ(PDBなど)から類似したテンプレートを探す テンプレートを基に3Dモデルを作成 モデルの品質を評価(GMQE, QMEANなど) 必要に応じて修正や最適化(エネルギー最小化やMDシミュレーション) SWISS-MODELとは? SWISS-MODEL は、ホモロジーモデリングを自動で行うオンラインツール です。 アミノ酸配列を入力するだけで、最適なテンプレートを選び、3Dモデルを生成してくれる ため、初心者でも使いやすいのが特徴です。 以下のリンクにあるタンパク質BRAFを参照し
Network Pharmacologyとは ネットワーク薬理学は、システムバイオロジーと計算科学を活用し、薬物が生体内の複数の標的や経路にどう作用するかを解析する分野です。従来の「1薬1標的」モデルではなく、「1薬多標的」アプローチを採用し、薬の効果や副作用を包括的に理解します。疾患関連遺伝子ネットワーク、薬物標的ネットワーク、シグナル伝達経路解析などを組み合わせ、副作用の予測やドラッグリポジショニング(既存薬の新たな適応症探索)を支援します。個別化医療にも応用され、患者ごとの遺伝子情報に基づいた最適な治療法の開発にも貢献しています。 Drug–Gene Interaction Network(薬物–遺伝子相互作用ネットワーク)とは? Drug–Gene Interaction Networkは、薬物と標的遺伝子の相互作用を解析し、薬の作用機序や副作用の予測に活用するネットワークモデルで
比較のポイント 商業的化合物を探したい場合 → ZINC15 購入可能な化合物が対象で、in silico創薬のスクリーニングに最適。 幅広い化学データを扱いたい場合 → PubChem 医薬品だけでなく、あらゆる化学物質をカバー。APIを利用した大規模データ解析にも向いている。 創薬のためのデータが欲しい場合 → ChEMBL 生物活性データとターゲット情報が豊富で、ドラッグデザインや標的探索に最適。 天然物のスクリーニングをしたい場合 → COCONUT 天然物に特化し、化合物の起源情報も確認できる。 より詳しくそれぞれを見ていきます。 主要なライブラリ ZINC15 ZINC15は、商業的に入手可能な化合物を中心に、数千万の化合物を収録した無料のデータベースです。研究者は、特定の物理化学的特性や構造に基づいて化合物を検索・ダウンロードできます。 ライブラリの入手の仕方 1. まずはこ
宣伝 こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます! 【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。 本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーションに関わる部分のツールの一部を紹介しています。プロジェクトの詳細については、iGEM-Wasedaの成果報告サイトをご覧いただければ幸いです。 MACEとは MACEは、機械学習ポテンシャル(Machine Learning Potential)の一種として開発されたツールで、材料内の原子間相互作用を高精度かつ高速に予測できるの
時系列分解の意義 多くの実世界のデータは、時間的な変化を伴った時系列データとして記録されます。需要予測、気象予報、株価分析など、時系列データを分析する分野は多岐にわたります。 時系列データは大抵以下のような構造が含まれています。 トレンド(Trend) : 長期的に増減する動き 季節成分(Seasonality) : 1年や1か月など一定の周期で繰り返す変動 残差(Residual) : 不規則な変動やノイズなど これらの成分を分解して扱えると、データの理解が格段に進み、将来予測や異常検知に応用する際にも有利になります。 伝統的な時系列分解モデル 加法モデル(Additive Model) 古典的な加法モデルによる時系列分解では、時系列 $y_t$ を以下のように表します。 $y_t = T_t + S_t + R_t$ $y_t$: 観測値 (Observed series) $T_t$
前回の記事で、scVeloを用いたRNA Velocity解析の基本を学びました。しかしながら、NCBI SRAなどの公共データベースのfastqファイルからどのようにRNA Velocity解析をやるのかイメージがつきづらいかと思います。この記事では、cellrangerから出力されたBAMファイルをvelocytoに読み込ませてloomファイルを作成して、RNA Velocity解析するためのファイルを準備する方法を学びます。 これによって好きな公共のシングルセルデータを使ってRNA Velocity解析ができるようになります。ぜひ学んでいきましょう。
10x Genomics Cell Rangerのデータを読み込むには? 結論からいうと、10x Genomics Cell Ranger pipelineのデータを読み込むにはmonocle3のload_cellranger_data()を使います。公式サイトでも言及されています。 https://cole-trapnell-lab.github.io/monocle3/docs/getting_started/#10x-output # Provide the path to the Cell Ranger output. cds <- load_cellranger_data("~/Downloads/10x_data") 注記: load_cellranger_dataは、umi_cutoffという引数を取ります。これは、セルに含まれるべきリード数を決定するものです。デフォルトでは
Trajectory解析とは? Trajectory解析(軌跡解析、軌道解析とも呼ばれる)は、シングルセルRNAシーケンス(scRNA-seq)データの解析において、細胞が時間経過とともにどのように状態を変化させていくのか、その過程(軌跡)を推定する手法です。従来のバルクRNA-seqでは細胞集団の平均的な遺伝子発現しか見えませんでしたが、scRNA-seqによって個々の細胞のトランスクリプトームを捉えることができるようになり、Trajectory解析によって細胞の動的な変化をより詳細に理解することが可能になりました。 Hussein A et al., 2021 より引用 https://www.nature.com/articles/s41467-021-26282-z Trajectory解析は、以下のような疑問に答えるのに役立ちます。 幹細胞はどのような細胞に分化していくのか?その
RNA Velocity解析とは? RNA Velocity解析は、一言で言うと、個々の細胞がどのような状態に変化していくのか(分化や状態変化の方向と速度)を予測する技術です。従来のRNA-Seqは細胞のスナップショット(静的な情報)しか捉えられませんでしたが、RNA Velocityは細胞内のmRNAのスプライシング状態に着目することで、時間的な変化(動的な情報)を捉えることを可能にしました。 https://www.nature.com/articles/s41586-018-0414-6 Bergen V, et al. Generalizing RNA velocity to transient cell states through hidden time. Nat Biotechnol. 2020;38(12):1408-1414. より引用 RNA Velocity解析では、
Trajectory解析をやってみたくないでしょうか。Trajectory解析ができれば、細胞の分化経路や遷移状態を推定することができます。しかし、Trajectory解析に用いるMonocle3はインストールが難しいことで定評があり、なかなか手が出せない人も多いのが現状です。本記事ではまずMonocle3をインストールするために、Rのパッケージ管理ツールであるrenvとRバージョン管理ツールであるrigを使って、Monocle3をインストールするところまでやってみます。 Trajectory解析を行う土台ができますので是非挑戦してみましょう。
空間トランスクリプトームの解析手法について行えるようになりたくありませんか?組織内の遺伝子発現を空間情報と関連付けて解析することで、空間情報と遺伝子発現を結びつけることで組織微小環境下における細胞間相互作用の理解につながります。本記事では、空間トランスクリプトーム解析の初歩的なプログラムを動かすことができるようになることを目標としています。ぜひトライしてみましょう。
宣伝 こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます! 【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。 本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーションに関わる部分のツールの一部を紹介しています。プロジェクトの詳細については、iGEM-Wasedaの成果報告サイトをご覧いただければ幸いです。 In Silico Evolution Pipelineとは このプロジェクトは、PET(ポリエチレンテレフタレート)を分解する酵素であるPETaseの分解活性を高めることで、BIND-
0. 量子化学計算用のソフトウェア: PySCFとは 参考文献[1]から引用 PySCF(Python Simulations of Chemistry Framework)は、Pythonベースのオープンソースの量子化学計算フレームワークです。PySCFは、高度な電子構造計算をシンプルかつ効率的に実行するためのツールを提供し、研究者や学生が量子化学の計算を容易に行えるように設計されています。 PySCFの主な特徴は以下の通りです: モジュラー設計:PySCFは、計算の各ステップ(分子の構造定義、基底状態の計算、励起状態の計算など)をモジュールとして提供しており、必要な部分だけを組み合わせて使用することができます。 高性能計算:内部に高度なアルゴリズムを使用しており、大規模な計算でも高速に処理を行うことができます。 柔軟性: Pythonベースであるため、スクリプトを通じて簡単に操作や拡張
解きたい問題 今回解きたい方程式は次のようなものです。 次の $u(x, t)$ にかんする偏微分方程式を与えられた条件のもとで解いてください。 $$ \frac{\partial^2 u}{\partial t^2} = (x + 1)\frac{\partial^2 u}{\partial x^2} + xe^{-t};\quad 0\le x\le 1, \quad 0\le t< \infty $$ 初期条件: $u(x, 0) = \sin \pi x, \frac{\partial u}{\partial t}(x, 0) = 0$ 境界条件: $u(0, t)= 0, u(1, t) = 0$ 方程式を解くプログラムをFortranで実装する こちらのページで解説されているように方程式を差分化して数値計算で答えを求めるプログラムを作成します。 Fortranで実装すると次のよ
宣伝 こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます! 【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。 本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーションに関わる部分のツールの一部を紹介しています。プロジェクトの詳細については、iGEM-Wasedaの成果報告サイトをご覧いただければ幸いです。 タンパク質言語モデルとは タンパク質言語モデルとは、自然言語処理(NLP)の技術をタンパク質のアミノ酸配列に応用し、タンパク質の機能や構造を予測するためのAIモデルです。 自然言語の文章
この記事では、EvoProtGradというツールを通して、タンパク質言語モデルを利用した指向性進化について紹介します。この記事を読むことで、コンピュータ上でタンパク質のアミノ酸配列に変異加えて、より高機能な変異体を探索する方法を学べます。ぜひトライしてみてください! 宣伝 こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます! 【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。 本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーションに関わる部分のツールの一部を紹介しています。プロジェクトの詳
本記事では、Pythonからタンパク質設計ツールRosettaを操作できるPyRosettaの使い方を紹介します。この記事を読むことで、PyRosettaのセットアップ方法や、分子ドッキングに必要なエネルギー最小化を行う方法、さらにロゼッタスコアを使ってタンパク質の安定性を評価する方法を学べます。ぜひトライしてみてください! 宣伝 こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます! 【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。 本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーション
はじめに Fortranには長い歴史があり、先人たちが作成した効率の良いアルゴリズムで実装されたプログラムがライブラリとして提供されている場合があります。これらのライブラリを自分たちのプログラムで使わない手はありません。 今回は、LAPACK / BLASという線形代数の計算ライブラリを利用する方法と、これらのライブラリを使うといかに実行速度が速くなるかを示したいと思います。 macOS Sonoma(14.7), gfortran (gcc version 14.1.0), Processor: 2.4 GHz 8-Core Intel Core i9, Memory: 32 GB 2400 MHz DDR4
Rを用いたsingle-cell ATAC-Seq data解析の方法をご存じでしょうか。single-cell ATAC-Seq data解析を行うと、各細胞ごとにクロマチンアクセシビリティー状態の分布を解析することが可能です。とても便利な手法なのでぜひチャレンジしてみましょう。 windows 10, R 4.4.0, Seurat 4.3.0, EnsDb.Hsapiens.v75 2.99.0, tidyverse 2.0.0, hdf5r 1.3.11, biovizBase 1.52.0, Signac 1.13 single-cell ATAC-Seq data解析とは? single-cell ATAC-Seq data解析とは、single-cell Assay for Transposase-accessible Chromatin with Sequencingの略で
近年、リモートセンシングデータの時系列解析は、地球科学や環境モニタリングの分野で重要性を増しています。代表的な例として、植生指標のNDVI(Normalized Difference Vegetation Index)があります。NDVIの経年変化を追跡することで、農業、森林管理、植生調査など、幅広い分野でのモニターや研究に活用されています。 しかし、リモートセンシングデータの解析には特有の課題が存在します。大気条件の変動、センサーの視野角の変化、雲の影響などにより、データにノイズが混入します。このノイズは季節変動や長期トレンドといった重要な情報を不明瞭にし、時系列解析の精度を著しく低下させる可能性があります。 本記事では、これらの課題を効果的に解決するツールとして、Savitzky-Golayフィルタを紹介します。このフィルタは、時系列データから有意な信号を抽出しながら、ノイズを効率的に
バッチ補正とは? バッチエフェクトとは、非生物学的な要因、つまり実験のセットアップや手順、機器の違いなどによって生じるデータのバリエーションのことを指します。これは、異なるバッチで生成されたデータを比較するときに特に問題となります。バッチエフェクトは、結果の解釈を歪め、偽の相関を生じさせる可能性があります。したがって、scRNA-seqデータを解析する際には、バッチエフェクトを適切に補正することが非常に重要です。 Harmonyとは? Harmonyは、各イテレーションで各クラスタのセルが可能な限り多くのバッチから来るようにする反復クラスタリングメソッドを使用し、各セルに適用する補正係数を計算します。このプロセスを繰り返してイテレーションごとに洗練し、収束するまで繰り返します。 https://portals.broadinstitute.org/harmony/articles/quic
In silico screeningとは? In silico screening(インシリコスクリーニング)とは、バーチャルスクリーニングの一種で、コンピューターシミュレーションを使用して、大規模な分子ライブラリーから、特定の生物学的標的に対して有望な化合物を選別するプロセスです。 In silico screeningでは、コンピューターモデルを用いて、大量の化合物の構造情報や生物学的活性を予測し、検討対象とするターゲットに対して最適な化合物を探索することができます。 このプロセスは、実験的に合成する前に、有望な化合物を選別し、合成の労力や費用を節約することができます。また、実験的なスクリーニングよりも高速であり、より多くの化合物を同時に検討できるため、薬物開発の効率を高めることができます。 In silico screeningは、薬剤の探索や、化学物質の特性予測、新しい材料の設計
はじめに 前回の記事では、1/4円の積分から円周率を求めるプログラムを使って、doループとファイルの書き出しというFortranを使った計算をするときに最も基本的でよく使うであろう機能を紹介しました。 その時には、積分計算の際に使われる分割数については、分割数が書かれただけのテキストファイルを用意し、結果を出力するファイルの名前については、プログラム本体に書いて指定していました。 しかし、実際の計算では、設定すべき変数の数が膨大になる場合があります。前回のような運用では行き詰まること必至です。前回のような書式のテキストファイルで変数の値を与える場合、何行目にどの変数の値を書いておく、というのを覚えておかなければならないですし、設定した値をあとから見直すのも難しいでしょう。 このような場合、namelistという機能を使うと便利です。ある決められた書式で書くことで、たくさんの変数の値を簡単に
次のページ
このページを最初にブックマークしてみませんか?
『トップページ - LabCode』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く