glTF 2.0 ファイルの全体像をさらっと把握できるような資料が見つからないので、個人的に調べたメモをここに貼っておきます。 いくらかの前提知識がある方は、プロパティ名を見るだけでも現状の glTF (のコア機能だけ)で何ができるのかの見当をつけられるのかなと思います。 glTF 2.0 の仕様書 このメモ記事は概要を俯瞰するだけですので、その後は仕様書を見てください: 追記: コメント欄にて、公式の概要図を日本語訳されている方の記事を紹介して頂きました: エンコード方式 glTFでは、シーンや各種オブジェクトの定義は全般的にJSONで記述し、頂点データなどのいわゆる「バッファ」部をバイナリで格納します。これらを最終的にどのようにエンコードするかについて、いくつかの選択肢が用意されています。 .gltf (JSON) + .bin (Binary buffer) (+ 画像ファイル) J