XLA: コンパイラを機械学習用に最適化する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。 XLA(Accelerated Linear Algebra)は、線形代数のためのドメイン固有のコンパイラで、ソースコードを変更せずに TensorFlow モデルを高速化することができます。 XLA を使用すると、速度とメモリ使用量が改善します。たとえば BERT の場合、8 個の Volta V100 GPU(XLA を使用)を使った MLPerf の提出物で、パフォーマンスが約 7 倍、バッチサイズが約 5 倍改善されることが確認されています。 概要 TensorFlow プログラムを実行すると、すべてのオペレーションが TensorFlow エグゼキュータによって個別に実行されます。TensorFlow の各オペレーションは、エグゼキュータによってプリコン