slay-tのブックマーク - はてなブックマーク

2021年最強になるか！？最新の画像認識モデルEfficientNetV2を解説 - Qiita
その他層の数も探索空間に入れています。ここで拡張率とは、MBConvの最初のConvでチャネル数を何倍にするかの係数のことで、こちらでより詳しく解説しています。探索は精度$A$、ステップごとの学習時間$S$、パラメータサイズ$P$を用いて、$A\cdot S^w\cdot P^v$を最大化するように行われます。ここで$w=-0.07, v=-0.05$であり、これらの値は実験的に決定されています。 1.3.2 EfficientNetV2のアーキテクチャ下表がEfficientNetV2のSサイズのモデルになります。画像: "EfficientNetV2: Smaller Models and Faster Training", Tan, M., Le, Q., (2021) 比較のためにEfficientNet-B0(i.e. V1)のアーキテクチャも下に載せます。画像: "Ef
slay-t 2021/04/14
学習

画像

qiita

勉強

機械学習

machinelearning

Deep Learning
リンク
出きたてホヤホヤ！最新オプティマイザー「AdaBelief」を解説！ - Qiita
オミータです。ツイッターで人工知能のことや他媒体の記事などを紹介していますので、人工知能のことをもっと知りたい方などは @omiita_atiimoをご覧ください！他にも次のような記事を書いていますので興味があればぜひ！【2020決定版】スーパーわかりやすい最適化アルゴリズム -損失関数からAdamとニュートン法- ついにAdamを超えた！最新の最適化アルゴリズム「RAdam」解説新たな活性化関数「FReLU」誕生&解説！ 2019年最強の画像認識モデルEfficientNet解説画像認識の大革命。AI界で話題爆発中の「Vision Transf ormer」を解説！ SGD+Momentum(緑)とAdam(赤)とAdaBelief(青)の比較。青が一番早く収束していることがわかります。 "AdaBelief Optimizer: Adapting Stepsizes by th
slay-t 2020/11/03
qiita

機械学習

python

machinelearning

pytorch

chainer
リンク
画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説！ - Qiita
0. 忙しい方へ完全に畳み込みとさようならしてSoTA達成したよ Vision Transf ormerの重要なことは次の3つだよ画像パッチを単語のように扱うよアーキテクチャはTransf ormerのエンコーダー部分だよ巨大なデータセットJFT-300Mで事前学習するよ SoTAを上回る性能を約$\frac{1}{15}$の計算コストで得られたよ事前学習データセットとモデルをさらに大きくすることでまだまだ性能向上する余地があるよ 1. Vision Transf ormerの解説 Vision Transf ormer(=ViT)の重要な部分は次の3つです。入力画像アーキテクチャ事前学習とファインチューニングそれぞれについて見ていきましょう。 1.1 入力画像まず入力画像についてです。ViTはTransf ormerをベースとしたモデル(というより一部を丸々使っている)ですが、
slay-t 2020/10/13
画像

学習

AI

コーディング

アーキテクチャ
リンク
Self-Attentionを全面的に使った新時代の画像認識モデルを解説！ - Qiita
08/31 (2020): 投稿 08/31 (2020): 「畳み込みを一切使わない」という記述に関して、ご指摘を受けましたので追記いたしました。線形変換においては「チャネル間の加重和である1x1畳み込み」を実装では用いています。 08/31 (2020): 本論文で提案されているモデルの呼称に関して認識が誤っていたためタイトルおよび文章を一部修正しました。言葉足らずの部分や勘違いをしている部分があるかと思いますが、ご指摘等をいただけますと大変ありがたいです。よろしくお願いします！(ツイッター:@omiita_atiimo) 近年の自然言語処理のブレイクスルーに大きく貢献したものといえば、やはりTransf ormerだと思います。そこからさらにBERTが生まれ、自然言語の認識能力などを測るGLUE Benchmarkではもはや人間が13位(2020/08現在)にまで落ちてしまっているほ
slay-t 2020/08/31
アルゴリズム

画像

self

qiita

機械学習

あとで読む

machinelearning

深層学習
リンク
新たな活性化関数「FReLU」誕生&解説！ - Qiita
オミータです。ツイッターで人工知能のことや他媒体で書いている記事などを紹介していますので、人工知能のことをもっと知りたい方などは気軽に@omiita_atiimoをフォローしてください！他にも次のような記事を書いていますので興味があればぜひ！【2020決定版】スーパーわかりやすい最適化アルゴリズム -損失関数からAdamとニュートン法- 画像認識の定番データセットImageNetはもう終わりかパラメータ数を激減させる新しい畳み込み「MixConv」解説！自然言語処理の王様「BERT」の論文を徹底解説【基本編】画像認識に使用されるData Augmentationを一挙にまとめてみた！画像認識に特化させた新たな活性化関数FReLU解説&実装！今やあらゆる分野で驚くべき結果を残し続けているニューラルネットワークですが、そのニューラルネットに無くてはならないものこそが活性化関数で
slay-t 2020/08/19
画像

C

qiita

Deep Learning
リンク
画像認識の定番データセットImageNetはもう終わりか - Qiita
オミータです。ツイッターで人工知能のことや他媒体で書いている記事などを紹介していますので、人工知能のことをもっと知りたい方などは気軽に@omiita_atiimoをフォローしてください！ 2012年にAlexNet[Krizhevsky, A.(2012)]が登場してから、画像認識分野での発展は著しい。その発展を支えてきたものこそ大規模データセットImageNet[Deng, J.(2009)]である。ImageNetでSoTAを達成すると、そのモデルには最強モデルの称号が与えられると言っても過言ではない。2020年6月にGoogle Brainによって出されたこの論文は、そんな当たり前に使われてきたImageNetデータセットに対して疑問符を叩きつけるものとなっている。現存のImageNetでの性能評価が必ずしも正しいのだろうか。この論文を通してその答えを探しにいく。本論文で使われて
slay-t 2020/08/05
画像

学習

qiita

勉強

機械学習
リンク
1