[B! CNN][コンピュータビジョン] misshikiのブックマーク

misshiki id:misshiki

CNNとコンピュータビジョンに関するmisshikiのブックマーク (8)

https://twitter.com/sam_murayama/status/1584148451385757702
misshiki 2022/10/24
“CNN vs. ViT”スライド資料のポイントまとめ。

CNN

Transformer

コンピュータビジョン
リンク
CNN vs. ViT
第57回コンピュータビジョン勉強会＠関東 https://kantocv.connpass.com/event/260132/ で読みました。CNNとViTの争いの現時点の情報をお届けしています。ただECCV 2022の論文を読んだのかと言われると怪しい…（ECCV2022の論文「も」読んだというのが正しい）
misshiki 2022/10/24
44ページのスライド資料。

CNN

Transformer

コンピュータビジョン
リンク
なぜビジョントランスフォーマーはこれほど高性能なのか。
3つの要点 ✔️ ViTは、すべての層でより均一な表現（特徴量）を持っている。つまり各層での表現が似ている。 ✔️ ViTは、自己注意（self-attention）により早期にグローバルな情報を集約できる。 ✔️ ViTは、表現を下位層から上位層へ強く伝搬させる。 Do Vision Transf ormers See Like Convolutional Neural Networks? written by Maithra Raghu, Thomas Unterthiner, Simon Kornbl ith, Chiyuan Zhang, Alexey Dosovitskiy (Submitted on 19 Aug 2021 (v1), last revised 3 Mar 2022 (this version, v2)) Comments: Published on arxiv.
misshiki 2022/05/16
“本論文ではCNN（ResNet）とViTを比較して、内部構造に驚くほど明確な違いがあることを示しました。”

CNN

Transformer

コンピュータビジョン
リンク
【論文5分まとめ】A ConvNet for the 2020s
この記事は、論文の内容を5分くらいで読めるようにまとめた記事です。そのため、前提となる知識や関連研究に関する説明は大幅に省略しています。基本的には筆者の備忘録ですが、面白そうと思ったら是非ご自身でも読んでみてください。概要 Vision Transf ormer以降、Visionの世界の中心はConvNetからTransf ormerへと移りつつある。しかし、ConvNetの設計空間は後発のTransf ormerのようには十分に「近代化」されておらず、古い慣習が残ったままであることも確かである。本研究では、ConvNetの設計空間を再検討したConvNeXtを提案している。ConvNeXtは標準的なConvNetモジュールから構成され、標準的なConvNetのシンプルさと効率性を維持しながら、精度や拡張性において最先端のTransf ormer系手法と遜色なく、87.8%のImageNet
misshiki 2022/01/26
“ConvNetの設計空間を再検討したConvNeXt”

Transformer

コンピュータビジョン

CNN
リンク
ビジョン・トランスフォーマーはなぜCNNより強い？その仕組みを解明【論文速報】
misshiki 2021/10/11
“ViT と CNN の違いを詳細に”

CNN

Transformer

コンピュータビジョン
リンク
胃がんを対象としたAI病理診断支援ソフトウェアの汎用性を実証
オリンパスは、AI病理診断支援ソフトウェアの実用化に向けた共同研究を呉医療センター・中国がんセンターなど6施設と実施した。病理標本に対して感度100％、特異度50％以上の精度を達成し、胃がんを対象とした汎用性を実証した。オリンパスは2021年8月25日、AI（人工知能）病理診断支援ソフトウェアの実用化に向けた共同研究で、同ソフトウェアが胃生検の病理標本に対して感度100％、特異度50％以上の精度で腺がんの判定をし、汎用性を実証したと発表した。同社は、2017年から呉医療センター・中国がんセンターと共同で、AI病理診断支援ソフトウェアの開発に取り組んできた。2020年からは製品化に向けた汎用性の検証、精度向上を目指し、呉医療センター・中国がんセンターを含む国内6施設との共同研究を進めている。
misshiki 2021/09/02
“AI病理診断支援ソフトウェアのディープラーニング技術には、病理画像の特徴解析に最適化したCNNを使用。”

CNN

コンピュータビジョン

ディープラーニング
リンク
Will Transformers Replace CNNs in Computer Vision?
In less than 5 minutes, you will know how the transf ormer architecture can be applied to computer vision with a new paper called the Swin Transf ormer
misshiki 2021/04/30
“Swin Transformerと呼ばれる新しい論文を使用して、トランスアーキテクチャをコンピュータビジョンに適用する方法を理解”

Transformer

コンピュータビジョン

CNN
リンク
双方向畳み込みプーリング「LiftPool」登場！
3つの要点 ✔️ 双方向プーリング手法"LiftPool"の提案 ✔️ 古典的な信号処理理論をもとに、プーリング処理での情報欠落を回避 ✔️ 画像分類・セグメンテーション等の様々なタスクで優れた性能・ロバスト性を発揮 LiftPool: Bidirectional ConvNet Pooling written by Jiaojiao Zhao, Cees G. M. Snoek (Submitted on 29 Sept 2020 (modified: 24 Feb 2021)) Comments: Accepted to ICLR2021. Subjects: bidirectional, pooling code：はじめに CNNにおけるプーリングは、受容野を広げること、入力変動に対するロバスト性を高めるなどのために非常に重要な動作です。しかしながら、既存のプーリングによる特徴量マ
misshiki 2021/03/15
“画像分類・セグメンテーション等の様々なタスクで優れた性能・ロバスト性を発揮”

CNN

コンピュータビジョン

ディープラーニング
リンク
1