エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
イメージパッチは波です:フェーズアウェアビジョンMLP
従来の畳み込みニューラルネットワーク(CNN)やビジョントランスフォーマーとは異なり、多層パーセプト... 従来の畳み込みニューラルネットワーク(CNN)やビジョントランスフォーマーとは異なり、多層パーセプトロン(MLP)は、完全に接続されたレイヤーによってのみスタックされる非常にシンプルなアーキテクチャを備えた新しい種類のビジョンモデルです。ビジョンMLPの入力画像は通常、複数のトークン(パッチ)に分割されますが、既存のMLPモデルは、異なる画像からのトークンのさまざまなセマンティック情報を無視して、固定の重みでそれらを直接集約します。トークンを動的に集約するために、各トークンを振幅と位相の2つの部分を持つ波動関数として表すことを提案します。振幅は元の特徴であり、位相項は入力画像のセマンティックコンテンツに応じて変化する複素数値です。位相項を導入すると、MLPのトークンと固定重みの間の関係を動的に調整できます。波のようなトークン表現に基づいて、ビジョンタスク用の新しいWave-MLPアーキテク
2021/11/25 リンク