Fixstars Tech Blog /proc/cpuinfo » 未分類 » 論文「Unsupervised Monocular Depth Estimation with Left-Right Consistency」を読んでみました (3):学習方法編 速度 学習速度 3万枚の画像を50 epoch学習するのにTitan X GPU 1基で約25時間 推論速度 512×256画像で35ms未満 (28 FPS以上) (GPU-CPU間のデータ転送時間込み) ハイパーパラメータなど パラメータ数 31 million (ResNetの場合、48 million) ハイパーパラメータ \(\alpha_{ap} = 1\), \(\alpha_{lr} = 1\) 前投稿の通り、マルチスケール(4スケール)の視差マップを出力します。 出力される視差は、 \(d_{max}=0.3 \t
