dannのブックマーク / 2020年7月10日 - はてなブックマーク

dann id:dann

2020年7月10日のブックマーク (7件)

(ソースコードメモ)PyTorchでのCUDA側並列処理 - Qiita
はじめに PyTorchのCUDAプログラミングに絞って並列処理を見てみる。なお、CPU側の並列処理は別資料に記載済みである。ここでは、 C++の拡張仕様であるCUDAの基礎知識カーネルレベルの並列処理 add関数の実装 im2col関数の実装ストリームレベルの並列処理 DistributedDataParallelの呼び出し処理の実装について説明する。おことわり PyTorchでは、ATen配下で演算処理を行っている。しかし、その前身であるTorchの資産を引き継いでいるため、THC(TorcH Cuda)のTensorからATen/nativeに書き換え中である。古いTHCTensor部分は参考資料として引用しておくが、言及はしない。また、この書き換え作業は1年以上継続中でありゆっくりと進んでいる。あと一年以上はかかるのではと思う。 BLAS(行列演算)やcudnn(深層学習演
dann 2020/07/10
pytorch
リンク
Slide 1
dann 2020/07/10
nccl

gpu
リンク
Slide 1
dann 2020/07/10
nccl
リンク
https://huggingface.co/docs/transformers/_modules/transformers/optimization
dann 2020/07/10
pytorch

scheduler
リンク
KerasのLearningRateSchedulerとPyTorchのLambdaLRの微妙な違い
学習率の調整は大事です。エポック後に学習率を減衰させる際、現在のエポックを引数として更新後の学習率を返す関数を与えると便利なことが多いです。この操作はKeras,PyTorchどちらでもできますが、扱い方が微妙に違うところがあります。ここを知らないでKerasの感覚のままPyTorchでやったらハマりまくったのでメモとして書いておきます。 Kerasの場合は「更新後の学習率」を返す Kerasの場合はわかりやすいです。エポックを引数として、更新後の学習率をそのまま返す関数を用意すればよいです。以下のコードの場合は「lr_scheduler」という関数ですね。 import keras from keras import layers import keras.backend as K def mnist_mlp(): input = layers.Input((784,)) x = lay
dann 2020/07/10
pytorch

schduler
リンク
PyTorch1.4での新機能 Schedulerのchainingを試す - Qiita
はじめにみなさんPyTorch1.4にはアップグレードしましたか？まだの方はこちらの公式からアップグレード方法を確認できます。（次のバージョンからPython2系がサポートされなくなるらしいので、注意してくださいね） PyTorch1.4の新機能としてSchedulerのchaining機能というのがひっそりと追加されていました。（リリースノートはこちら）早速試してみます。 Schedulerとは Schedulerを使うと、学習率をEpoch毎に変化させることができます。学習率は高くした方が早く学習が進むのですが、学習率が高すぎるままだと、最適解を飛び越してしまう恐れがあります。なのでNNの学習時にはSchedulerを使い、Epoch数が進むにつれて徐々に学習率を下げていくのが定石になっています。（今回の話とは直接関係ありませんが、PyTorchのスケジューラはKeras等と違
dann 2020/07/10
pytorch
リンク
http://arxiv.org/pdf/1711.07240
dann 2020/07/10
deeplearning
リンク
- 2020年7月11日
- 2020年7月10日
- 2020年7月9日