タグ

ブックマーク / qiita.com/mi-212 (1)

  • 結晶・分子グラフの効率的なDataLoader実装を考える - Qiita

    はじめに 最近は結晶構造や分子構造をグラフ構造で表現し、機械学習を行うことが流行っています。特に、DFT計算でのエネルギーなどの出力をグラフニューラルネットワーク(GNN)で学習する、ニューラルネットワークポテンシャル(NNP)が非常に注目されています。ハイスループット計算により大規模なDFTデータセットの作成が可能になりつつあり、学習を行う際には結晶構造をグラフ化するコストも考える必要があります。 そこでこの記事では簡便かつ高速にpytorchのDataLoaderグラフデータを取得する方法を考えます。 必要なライブラリ ase lmdb ocpmodels (グラフ化のために、AtomsToGraphのみ使用) torch torch-geometric 実装方法 以下の3通りを試してみます。 aseのデータベースから読み込み LMDBから読み込み cifファイルから読み込み ase

    結晶・分子グラフの効率的なDataLoader実装を考える - Qiita
  • 1