misshikiのブックマーク - はてなブックマーク

misshiki id:misshiki

ブックマーク / speakerdeck.com/yushiku (5)

CNN vs. ViT
第57回コンピュータビジョン勉強会＠関東 https://kantocv.connpass.com/event/260132/ で読みました。CNNとViTの争いの現時点の情報をお届けしています。ただECCV 2022の論文を読んだのかと言われると怪しい…（ECCV2022の論文「も」読んだというのが正しい）
misshiki 2022/10/24
44ページのスライド資料。

CNN

Transformer

コンピュータビジョン
リンク
Transformer
2022年6月8日にSSII 2022のチュートリアル講演で使用 2023年2月2日に順天堂大学産学連携講座：AI 技術とビジネス活用で使用 2017年に機械翻訳を対象として提案されたTransf ormerは、従来の畳込みや再帰を排して自己注意機構を活用したニューラルネットワークです。2019年頃からコンピュータビジョン分野でも急速に応用が進んでいて、より柔軟かつ高精度なネットワーク構造としての地位を確立しつつあります。本スライドでは、そんなTransf ormerの最前線を概説しています。基盤モデルやVision Transf ormer、MLP/CNNの逆襲についても取り扱っています。・そもそもTransf ormerって？・Transf ormer旋風と基盤モデル・Transf ormerのノウハウ・Transf ormerはオワコン？！・CNNはオワコン？！
misshiki 2022/06/20
95ページのスライド資料。

Transformer

自然言語処理

コンピュータビジョン
リンク
Vision and Language とその先へ
2022年2月9日（水）- 11日（金）第6回統計・機械学習若手シンポジウムでの講演資料です。 CNNの画像認識におけるブレークスルーから10年、Transf ormerの機械翻訳におけるブレークスルーから5年。異なる様態のデータに対する機械学習応用の相互参入障壁が大きく緩和された現在、画像情報と言語情報による理解や変換・生成を目的とするVision and Languageは、その周辺分野も巻き込みながら勢いを増している研究分野です。本講演では、Vision and Languageと呼ばれる各研究課題の生い立ちや発展、そして今後の課題について概観します。いままでもビジョン＆ランゲージの講演は何度とやらせて頂いておりますが、今回少し気合を入れて更新しました。ビジョン＆ランゲージは本当にタスクが色々増えて来て収集が付かない状況ですが、90分の講演で自分が考え得る限りでは最大のカバレッジ
misshiki 2022/02/14
154ページと大ボリュームのスライド資料。

コンピュータビジョン

自然言語処理
リンク
ICCV 2021 ただただVision and Languageの論文を読んでみた
第九回全日本コンピュータビジョン勉強会 (2021/12/12) で紹介しました。 Vision and Language芸人としてICCV 2021で発表された関連論文約60本から独断と偏見でキュレーションしたものです。これまでのVision and LanguageやTransf ormer自体を詳しく知りたい人はコンピュータビジョン最前線をご参照ください！（ダイマ） https://www.kyoritsu-pub.co.jp/bookdetail/9784320125421
misshiki 2021/12/13
34ページのスライド資料。

コンピュータビジョン

自然言語処理
リンク
Do Transformer Modifications Transfer Across Implementations and Applications?
第六回　全日本コンピュータビジョン勉強会 Transf ormer論文読み会で「Do Transf ormer Modifications Transfer Across Implementations and Applications?」を読みました。 Transf ormerを改善する色々な手法が提案されているけど、ちゃんと評価すると元のTransf ormerと大差ない精度しか出ない、というのがメインの主張ですが果たして…？
misshiki 2021/04/20
55ページのスライド資料。

Transformer
リンク
1