タグ

Chainerとfine-tuningに関するohnabeのブックマーク (4)

  • Chainerでfine-tuningを行う - Qiita

    すでにトレーニングされたモデルからWやbなどの重みを取得することで、より早く学習を進めることができる (fine-tuning)。 モデル自体が完全に同じ場合には当然使えるし、モデルの一部を修正して使用する場合にも、変更の必要がない層に関しては、あらかじめ学習済みのモデルから重みを借用するのが良い。例えば、分類先の画像種類が1000種類から10種類に切り替える場合などは、最終の全結合層のみ切り替える必要はあるが、それ以前の畳み込み層などは変更の必要性は少なく、その部分の重みを使用することができる。 計算時間短縮に結びつく背景には、以下のような点が挙げられる: - あらかじめ大量の計算資源を使用して収束した時点の結果を使用するため、それまでの計算時間を省略可能。特に、畳み込み層の第一層はガボールフィルタに近似するという研究も多く、あえてそこを新規で学習させる必要性はあまり感じられない - ま

    Chainerでfine-tuningを行う - Qiita
  • CUDAなしMacで、Chainer使ってCaffeモデルをインポートして画像認識させてみる

    CUDAなしMacで、Chainer使ってCaffeモデルをインポートして画像認識させてみる
  • chainerのAlexnetを用いてFine Tuningをする | TOMMY NOTES

    はじめにも記述しましたが、学習済みのパラメータを使って自分で学習させたい層だけコピーせずに学習させます。特定の層のみ学習させると言っても、実際にはすべての層を学習させてると思います。 モデルが大きくなり大量の画像を学習させると深い層のパラメータは簡単には更新されないそうです。 それはつまり、どの画像においても重用な低次元の特徴が低層のパラメータに反映されているので、自分で判別したい画像群を学習させたい時は高層のみが自然と学習されます。 パラメータのコピーのコードは参考にさせていただいたページで使われているものを使用させていただきます。このコードは同じレイヤー名であった場合はパラメータをコピーします。 つまり、自分で学習させる層はコピー元(学習済alexnet)に無い名前をつけましょう。 import chainer def copy_model(src, dst): assert isin

  • Chainer によるシーン認識

    in English はじめに 先のページで Caffe を使ったシーン認識(15分類問題)を試みた。今回は、Caffe の学習済みモデルを Chainer を使って Fine-Tuning することにより同じシーン認識を行ってみる。 計算機環境 これまでと同じく、Amazon EC2 にある g2.2xlarge を利用した。GPU を搭載したインスタンスである。 データセット 先と同じ LSP15 を利用する。このデータセットは15個のディレクトリから構成されている。 MITcoast MITforest MIThighway MITinsidecity MITmountain MITopencountry MITstreet MITtallbuilding bedroom CALsuburb industrial kitchen livingroom PARoffice store

    Chainer によるシーン認識
  • 1