第三夜は、方策ネットワークについて記述します。 ある意味考え方として前半の最大の山場です。 基本的には、昨夜のChainerの基本がもとになります。 ### 説明したいこと (1)基本はMNISTと同じ (2)入力チャンネルについて (3)出力チャンネルについて (4)方策ネットワークのコード ### (1)基本はMNISTと同じ ということで、mnistのモデルをおさらいしましょう。 ネットワーク定義は以下のとおりでした。 # ネットワーク定義 class MLP(Chain): def __init__(self, n_units): super(MLP, self).__init__() with self.init_scope(): self.l1 = L.Linear(None, n_units) # 入力層 self.l2 = L.Linear(None, n_units) #

