タグ

CNNとchainerに関するclavierのブックマーク (2)

  • chainerでモデルを入れ子にしたら重みが更新されなかった話 - johshisha’s diary

    概要 chainerのmodel(Chainクラス)を入れ子にして使っていたら重みが更新されなかった. Chainクラスで重みの更新がされるのは self.init_scope()内に書いている linkオブジェクトだけだったことが判明し, with self.init_scope():以下に書くとちゃんと更新された. 状況 version chainer==3.0.0 やりたかったこと あるmodelAに layerNを追加して,新たに modelBを作成したかった. だめなコード 計算グラフを出力すると,ちゃんとmodelA -> layerN という風に接続されていたので,これでうまく接続されているものだと思っていた. が,実際に学習中に都度重みを出力してみると,modelA内の重み(l1, l2, l3の重み)が全く更新されていないことがわかった. # example/train_

    chainerでモデルを入れ子にしたら重みが更新されなかった話 - johshisha’s diary
  • Chainerで画像のキャプション生成 - Qiita

    概要 Chainerを使って画像のキャプション生成を実装しました。画像を入力するとその説明文を生成します。ソースコードは以下にあります。 https://github.com/dsanno/chainer-image-caption 以下の論文のアルゴリズムを使いました。 Show and tell: A neural image caption generator すでにChainerでキャプション生成を実装されている方もいたので、そちらも参考にしました。 Image caption generation by CNN and LSTM ~ Satoshi's Blog from Bloomington キャプション生成モデル 論文で使用するキャプション生成モデルは大きく分けて3つのネットワークで構成されています。 画像をベクトルに変換する${\rm CNN}$ ${\rm CNN}$に

    Chainerで画像のキャプション生成 - Qiita
  • 1