論文 は いくつかあるのでしょう が、まず は 大御所 Bengio先生 の 以下の論文 が 参考 に なります。 ( 論文 ) Yoshua Bengio Practical Recommendations for Gradient-Based Training of Deep Architectures 以下 の やりとり の中 で 言及されています。 Google group Chainer Japanese User Group 「LSTMにおける中間層のユニット数」 yukinoji お世話になっております。 chainerを利用してLSTMモデルを構築しているのですが、中間層のユニット数の設定が上手くいかず困っております。 現在およそ15000次元の数値ベクトルを入力として与え、それが0,1の2つのクラスのどちらに所属しているかを教師データとして与え、学習を行うよう実装している