Hi, I am trying to get Horovod trainings running on a cluster built from Nvidia RTX 2080 ti GPUs and Infiniband interconnects. Installed software: Ubuntu 16.04.5 LTS Cuda 10.0.130-1 NCCL 2.4.2-1+cuda10 Open MPI 3.1.2 Mellanox OFED 4.4-2.0.7.0 Tensorflow 1.13.1, custom built without XLA support Horovod 0.16 This is the device topology (PCI express dual root): $ nvidia-smi topo -m GPU0 GPU1 GPU2 GPU
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く