ADAMとAdaGradを比較したhttp://t.co/B9sid4RdNA 簡単な2次元関数で試すとAdaGradが2023回使ったところ,ADAMが何と83回で収束! 驚異的… ただ,論文推奨のαはこの場合,小さすぎて遅いことに注意.
ADAMとAdaGradを比較したhttp://t.co/B9sid4RdNA 簡単な2次元関数で試すとAdaGradが2023回使ったところ,ADAMが何と83回で収束! 驚異的… ただ,論文推奨のαはこの場合,小さすぎて遅いことに注意.
少し前の論文ですが,backpropagationは最近また人気があるので実装するときに参考になると思います.特に,sigmoidかtanhか迷ったら読んでみると良いです.http://t.co/3JHgyoylIW
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く