[B! tensorflow] dannのブックマーク

Add MPI cluster resolver and update documentation of SLURM cluster resolver by Flamefire · Pull Request #38112 · tensorflow/tensorflow

dann 2024/10/11

リンク

プロファイラを使用した TensorFlow のパフォーマンス最適化 | TensorFlow Core

このガイドでは、TensorFlow Profiler で提供されているツールを使用して、TensorFlow モデルのパフォーマンスを追跡する方法を説明します。また、ホスト（CPU）、デバイス（GPU）、またはホストとデバイスの両方の組み合わせでモデルがどのように機能するかを確認します。プロファイリングは、モデル内のさまざまな TensorFlow 演算（op）によるハードウェアリソース消費（時間とメモリ）を把握し、パフォーマンスのボトルネックを解消して最終的にモデルの実行を高速化するのに役立ちます。このガイドでは、プロファイラのインストール方法、利用可能なさまざまなツール、プロファイラのさまざまなパフォーマンスデータ収集モード、およびモデルのパフォーマンスを最適化するために推奨されるベストプラクティスについて説明します。 Cloud TPU 上でモデルのパフォーマンスをプロファイリ

dann 2024/02/01

リンク

TensorFlow、機械学習の開発を加速するオープンソースツールが拡充〜Google I/O 2023から - BRIDGE（ブリッジ）

TensorFlow、機械学習の開発を加速するオープンソースツールが拡充〜Google I/O 2023から Image credit: Google 5月10日の Google I/O における大きな人工知能（AI）に関するニュースは、大規模言語モデル「PaLM 2」の発表だが、このイベントにおけるAIニュースはそれだけではない。 Google は、オープンソースの機械学習（ML）技術のアップデートと、成長中の TensorFlow エコシステムの機能強化を相次いで発表した。TensorFlow は、Google が主導するオープンソース技術の取り組みで、開発者がモデルを構築して訓練するのに役立つ ML ツールを提供している。 Google は、Google I/O で新技術「DTensor」を発表した。この技術は、MLトレーニングに新しい並列化技術をもたらし、モデルトレーニングとスケ

dann 2023/05/17

tensorflow

リンク

tf.keras.callbacks.TensorBoard | TensorFlow v2.16.1

dann 2023/04/29

リンク

TensorFlow Model Optimization

import tensorflow as tf import tensorflow_model_optimization as tfmot model = tf.keras.Sequential([...]) pruning_schedule = tfmot.sparsity.keras.PolynomialDecay( initial_sparsity=0.0, final_sparsity=0.5, begin_step=2000, end_step=4000) model_for_pruning = tfmot.sparsity.keras.prune_low_magnitude( model, pruning_schedule=pruning_schedule) ... model_for_pruning.fit(...) TensorFlow Model Optimization

dann 2023/03/08

リンク

tensorflow/async_collective_creator.cc at master · tensorflow/tensorflow

dann 2022/09/13

リンク

Tf Xla Generate Benchmarks - a Hugging Face Space by joaogante

dann 2022/07/31

tensorflow

リンク

optuna-examples/tfkeras/tfkeras_integration.py at main · optuna/optuna-examples

dann 2022/04/17

リンク

Memory increase over trials · Issue #1178 · optuna/optuna

dann 2022/04/17

リンク

Optuna + Keras が GPU のメモリを食いつぶす - Qiita

Optuna で Keras (TensorFlow GPU) のハイパーパラメータを最適化しようと思ったのですが、しばらく trial を繰り返すと GPU の OOM エラーが発生し失敗してしまいました。解決までかなり手こずったので、忘れないうちにメモしておきます。なお、私がこの問題に遭遇したのがたまたま Optana で最適化しようとしたタイミングだったというだけで、問題自体は Optana に限った話ではありません。クロスバリデーションやグリッドサーチなど、1回の実行で複数回 Keras の学習処理が GPU で走るような処理を書いた場合に常に起こりえます。メモリを食いつぶすコード例 (Before) Optuna デビュー戦ということで試しに学習率を最適化してみようと思い、以下のようなコードを書きました (※説明に必要な部分だけ抜粋したため動かないかも……)。各 trial

dann 2022/04/17

リンク

https://hub.docker.com/layers/tensorflow/tensorflow/latest-gpu/images/sha256-1e03623e335aac1610b1a3cfa6a96cf10156acb095287f9d6031df3980148663?context=explore

dann 2022/03/15

リンク

TensorFlow・PyTorchによる分散学習

深層学習モデルの学習は、学習データの一部を抽出・勾配を計算するミニバッチ学習によって行われることが一般的です。勾配のばらつきを抑えるためには、ある程度のバッチサイズを保持する必要があります。一方で、バッチサイズの上限は利用するマシン（GPUやTPU）のメモリによって制約を受けるため、大規模なモデルや高解像度画像などを用いる際には、バッチサイズを小さくせざるを得ない場合があります。これに対して複数のGPUや計算ノードを利用できる場合には、並列化によって単一GPUの時よりも大規模な学習を行うことができます。複数の計算機を用いた並列学習（分散学習）には大きく分けてデータ並列とモデル並列が存在しており、合わせて利用することもできます。データ並列（Data Parallel）：ミニバッチを複数の計算機に分散する方法モデル並列（Model Parallel）：一つのモデルを複数の計算機に分散する

dann 2022/03/15

tensorflow

リンク

TensorFlow Release Notes :: Deep Learning Frameworks Documentation

dann 2022/03/15

tensorflow

リンク

Container update tensorflow:20.10-tf1-py3 -> tensorflow:20.12-tf1-py3 by johndpope · Pull Request #51 · NVlabs/stylegan2-ada

dann 2022/03/15

tensorflow

リンク

tensorflow2のtf.dataを使ってaugmentationを高速化する - Qiita

はじめに Kerasやtf.kerasのImageDataGeneratorは遅いので、tf.data.Datasetを使って学習を高速化してみます。今回データ水増しにはKeras Preprocesing Layerを使用します。**注：tensorflow2.3.0では使用可能ですが、まだ実験段階の機能とのことです。**なのでご注意ください。環境 python 3.6.9 tensorflow 2.3.0 GPU　GTX1060 参考文献１．TensorFlow公式チュートリアルチュートリアルらしく、step-by-stepでわかりやすいです。２．TensorFlowで使えるデータセット機能が強かった話 tf.data.Datasetについてメチャクチャわかりやすい解説。とくにshuffleの説明がすごく良かったです。ありがとうございます。３．scikit-learn、Ke

dann 2022/03/14

tensorflow

リンク

tutorial/imagenet/12min-imagenet-training.MD · master · Yin, Junqi / mldl-hpc · GitLab

dann 2022/03/08

リンク

Add in-place broadcast for TensorFlow by maxhgerlach · Pull Request #3128 · horovod/horovod

dann 2022/03/07

リンク

世界最大規模のディープラーニングを「富岳」で実施して世界一になりました - fltech - 富士通研究所の技術ブログ

はじめにこんにちは。富士通株式会社ICTシステム研究所のMLPerf HPC五人衆です。先週、国際学会SC’21 において、理化学研究所/富士通が共同で開発した新しいスーパーコンピュータ（スパコン）「富岳」がスパコンランキングで4期連続の4冠(TOP500, HPCG, HPL-AI, Graph500)を獲得しましたが、同会議で発表された、実際のディープラーニング(DL)学習処理に特化したMLPerfTM HPC ベンチマークにおいても世界一を獲得しました。本ブログでは、このMLPerf HPCの一つのアプリケーションであるCosmoFlowの学習を「富岳」で大規模に行い世界一となった、その挑戦についてお話させてもらいます。はじめに背景 MLPerf HPCって何？（白幡） CosmoFlowって何？（田渕）「富岳」って何？（田渕）プロセッサ通信ネットワークストレージ準

dann 2021/11/28

tensorflow

リンク

PyTorch, ONNX, Caffe, OpenVINO (NCHW) のモデルをTensorflow / TensorflowLite (NHWC) へお手軽に変換する - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 日本語　English 1. はじめにいつも左中間を狙うようなプチニッチなふざけた記事ばかりを量産しています。この記事の手順を実施すると、最終的に PyTorch製高精度Semantic Segmentation の U^2-Net を TensorFlow Lite へ変換することができます。下図のような感じです。 TensorFlow めちゃくちゃ扱いにくいです。日々公開される最新のとても面白いモデルは軒並みPyTorch実装ですし、なんでTensorFlowで実装してくれないんだ！！と、常日頃思っています。論文のベ