arxiv_readerのブックマーク / 2021年12月9日 - はてなブックマーク

arxiv_reader id:arxiv_reader

2021年12月9日のブックマーク (105件)

LiMoSeg：リアルタイムの鳥瞰図ベースのLiDARモーションセグメンテーション
arxiv_reader 2021/12/09
移動物体の検出とセグメンテーションは、自動運転パイプラインの重要なタスクです。車両周辺の静的コンポーネントと移動コンポーネントを検出して分離することは、経路計画とローカリゼーションタスクで特に重要です

autonomous driving

real time

detection

augmentation

segmentation

LiDAR

classification

arXiv reaDer

arXiv
リンク
FLAVA：基本的な言語とビジョンの調整モデル
arxiv_reader 2021/12/09
最先端のビジョンおよびビジョンと言語のモデルは、さまざまなダウンストリームタスクで優れたパフォーマンスを実現するために、大規模なVisio-言語の事前トレーニングに依存しています。一般に、このようなモ

contrastive

arXiv

arXiv reaDer
リンク
ソファの後ろには何がありますか？ 3Dシーン再構成のための指向性光線距離関数（DRDF）
arxiv_reader 2021/12/09
見えないRGB画像からの遮蔽領域を含むシーンレベルの3D再構成のアプローチを提示します。私たちのアプローチは、実際の3Dスキャンと画像で訓練されています。この問題は、複数の理由で困難であることが証明さ

reasoning

reconstruction

arXiv reaDer

3D

arXiv
リンク
自己監視型ビデオ表現学習における時間的粒度の調査
arxiv_reader 2021/12/09
この作品は、ビデオ表現の学習における時間的粒度を探求するためのTeGという名前の自己監視学習フレームワークを提示します。 TeGでは、ビデオから長いクリップと、長いクリップの内側にある短いクリップをサ

embedding

video

self-supervised

pre-training

arXiv reaDer

representation learning

arXiv

benchmark
リンク
効率的なビデオ理解のための視覚言語モデルの促進
arxiv_reader 2021/12/09
視覚言語の事前トレーニングは、大規模なWebデータから視覚とテキストの共同表現を学習するのに大きな成功を収めており、ゼロショットの一般化に優れた能力を示しています。この論文では、事前に訓練された視覚言

zero-shot

transformer

action recognition

video

representation

few-shot

pre-training

arXiv reaDer

arXiv

benchmark
リンク
3Dの外観、場所、ポーズを予測して人を追跡する
arxiv_reader 2021/12/09
この論文では、将来の3D表現を予測することにより、単眼ビデオで人々を追跡するためのアプローチを提示します。これを実現するために、まず、堅牢な方法で1つのフレームから3Dに人を持ち上げます。このリフティ

monocular

video

arXiv

representation

arXiv reaDer

3D

person

tracking

pose

benchmark
リンク
近隣コンポーネント分析のレンズを通して対照学習を再考する：統合されたフレームワーク
arxiv_reader 2021/12/09
自己監視表現学習の独創的なツールとして、対照学習は近年前例のない注目を集めています。本質的に、対照学習は、表現学習のために正と負のサンプルのペアを活用することを目的としています。これは、特徴空間の近隣

contrastive learning

adversarial

attention

self-supervised

arXiv reaDer

representation learning

arXiv
リンク
USB：ユニバーサルスケールのオブジェクト検出ベンチマーク
arxiv_reader 2021/12/09
COCOなどのベンチマークは、オブジェクトの検出において重要な役割を果たします。ただし、既存のベンチマークはスケールの変動が不十分であり、それらのプロトコルは公正な比較には不十分です。本稿では、ユニバ

detection

domain

arXiv reaDer

dataset

arXiv

benchmark
リンク
視覚と言語のモデリングのためのMLPアーキテクチャ：経験的研究
arxiv_reader 2021/12/09
視覚と言語（VL）の融合のためのMLPアーキテクチャの使用に関する最初の実証的研究を開始します。 5つのVLタスクと5つの堅牢なVQAベンチマークに関する広範な実験を通じて、次のことがわかりました。（

transformer

attention

pre-training

bias

arXiv reaDer

VQA

arXiv

benchmark
リンク
すべてを一度に-ビデオ検索用のマルチモーダルFusionTransformer
arxiv_reader 2021/12/09
ビデオデータからのマルチモーダル学習は、ゼロショットの取得や分類などのタスクを可能にする人間の注釈なしで意味的に意味のある埋め込みをトレーニングできるため、最近注目を集めています。この作業では、ビデオ

embedding

zero-shot

transformer

localization

attention

classification

arXiv reaDer

dataset

arXiv

benchmark
リンク
野生の視聴覚同期
arxiv_reader 2021/12/09
この論文では、「インザワイルド」（つまり、音声以外の一般的なクラス）のビデオに適用されるオーディオビジュアル同期の問題について考察します。新しいタスクとして、視聴覚相関の高いテストセット、つまりVGG

metric

video

domain

arXiv reaDer

dataset

arXiv

benchmark
リンク
SoK：深回転推定のための車両方向表現
arxiv_reader 2021/12/09
近年、3D自動運転車の物体検出アルゴリズムの流入。ただし、方向予測にはほとんど注意が払われていませんでした。既存の研究ではさまざまな予測方法が提案されていますが、全体的で決定的なレビューは行われていま

detection

representation

attention

vehicle

arXiv reaDer

estimation

3D

dataset

arXiv
リンク
FPPN：自動運転のための将来の疑似LiDARフレーム予測
arxiv_reader 2021/12/09
LiDARセンサーは、信頼性の高い3D空間情報により、自動運転で広く使用されています。ただし、LiDARのデータはまばらであり、LiDARの頻度はカメラの頻度よりも低くなっています。より高密度の点群を

autonomous driving

sparse

point cloud

optical flow

LiDAR

arXiv reaDer

estimation

3D

arXiv

benchmark
リンク
ノイズを見ることで見ることを学ぶ
arxiv_reader 2021/12/09
現在の視覚システムは巨大なデータセットでトレーニングされており、これらのデータセットにはコストが伴います。キュレーションは高価であり、人間の偏見を継承し、プライバシーと使用権に関する懸念があります。こ

human

representation

learning

generative

bias

arXiv reaDer

contrastive

dataset

arXiv
リンク
教師なしクラス-混乱による増分学習
arxiv_reader 2021/12/09
継続学習に関する多くの研究は、壊滅的な忘却を軽減するための有望な結果を示していますが、教師ありトレーニングに依存しています。ラベルにとらわれない増分設定で正常に学習するには、モデルは学習済みクラスと新

detection

arXiv reaDer

learning

classification

unsupervised

arXiv
リンク
視覚的な自己監視とそのモデルの堅牢性への影響について
arxiv_reader 2021/12/09
最近の自己監視方法は、完全な監視に匹敵する可能性のある特徴表現の学習に成功しており、モデルの堅牢性の向上や分布外の検出など、いくつかの点でモデルに有益であることが示されています。私たちの論文では、事前

detection

representation

learning

adversarial

self-supervised

pre-training

arXiv reaDer

OOD

arXiv
リンク
読んだ後に燃やす：クロスドメインストリーミングデータのオンライン適応
arxiv_reader 2021/12/09
オンラインプライバシーのコンテキストでは、多くの方法で、機密データを保護するための複雑なプライバシーとセキュリティの保護手段が提案されています。このホワイトペーパーでは、次のように主張します。機密デー

arXiv reaDer

domain adaptation

unsupervised

arXiv

benchmark
リンク
SwinTrack：変圧器追跡のためのシンプルで強力なベースライン
arxiv_reader 2021/12/09
Transformerは最近、視覚的追跡アルゴリズムを改善する明確な可能性を示しました。それにもかかわらず、既存のトランスフォーマーベースのトラッカーは、ほとんどの場合、トランスフォーマーを使用して、

transformer

arXiv

CNN

arXiv reaDer

dataset

tracking
リンク
正確なコピー検出のための大容量メモリバンクと負の埋め込み減算による対照学習
Contrastive Learning with Large Memory Bank and Negative Embedding Subtraction for Accurate Copy Detection 画像がデータベース内の画像の変更されたコピーであるかどうかを判断するタスクであるコピー検出は、未解決の問題です。したがって、対照的な学習で畳み込みニューラルネットワーク（CNN）をトレーニングすることにより、コピー検出に取り組みました。大容量のメモリバンクとハードデータ拡張を使用したトレーニングにより、CNNはより識別力のある表現を取得できます。提案された負の埋め込み減算は、コピー検出の精度をさらに高めます。私たちの手法を使用して、Facebook AI画像類似性チャレンジ：記述子トラックで1位を獲得しました。私たちのコードはここで公開されています：https：//github.
arxiv_reader 2021/12/09
画像がデータベース内の画像の変更されたコピーであるかどうかを判断するタスクであるコピー検出は、未解決の問題です。したがって、対照的な学習で畳み込みニューラルネットワーク（CNN）をトレーニングすること

embedding

detection

augmentation

CNN

contrastive learning

representation

arXiv reaDer

arXiv
リンク
一般化可能で効率的なニューラルヒューマンレンダリングのためのジオメトリガイドプログレッシブNeRF
arxiv_reader 2021/12/09
この作業では、まばらなカメラビューの設定の下で、忠実度の高い自由視点の人体合成のための一般化可能で効率的なニューラルラディアンスフィールド（NeRF）パイプラインを開発します。既存のNeRFベースの方

sparse

human

synthesis

arXiv reaDer

dataset

arXiv
リンク
画像検索のためのロバストで分解可能な平均精度
arxiv_reader 2021/12/09
画像検索では、標準の評価指標は、平均精度（AP）などのスコアランキングに依存します。この論文では、APを使用したディープニューラルネットワークのエンドツーエンドトレーニングの2つの主要な課題である非微

metric

approximation

loss function

arXiv reaDer

differentiable

dataset

arXiv
リンク
GCA-Net：画像偽造のローカリゼーションと検出を改善するためのゲートコンテキストアテンションの利用
arxiv_reader 2021/12/09
フォレンジック分析は、操作された画像からの隠れた痕跡の識別に依存します。従来のニューラルネットワークは、機能の減衰を処理できず、主要な空間機能に依存しているため、このタスクに失敗します。この作業では、

detection

learning

localization

attention

arXiv reaDer

identification

dataset

arXiv

benchmark
リンク
ビデオの異常検出のための階層的時空間グラフ畳み込みニューラルネットワーク
arxiv_reader 2021/12/09
深層学習モデルは、監視ビデオの異常検出に広く使用されています。一般的なモデルには、正常なビデオを再構築し、異常なビデオの再構築エラーを評価して異常の程度を示す機能が備わっています。ただし、既存のアプロ

anomaly detection

spatio-temporal

CNN

representation

dataset

reconstruction

arXiv reaDer

pedestrian

arXiv

benchmark
リンク
非対称で不確実性を意識したGANによる悪天候画像の翻訳
arxiv_reader 2021/12/09
悪天候の画像変換は、悪条件ドメイン（たとえば、雨の夜）を標準ドメイン（たとえば、日）に転送することを目的とした教師なし画像間（I2I）変換タスクに属します。不利なドメインからの画像にはいくつかのアーテ

arXiv reaDer

GAN

domain

disentangling

unsupervised

arXiv
リンク
DMRVisNet：霧深い天候下でのピクセル単位の視程推定のためのディープマルチヘッド回帰ネットワーク
arxiv_reader 2021/12/09
シーンの認識は、意思決定と交通安全を推進するために不可欠です。しかし、一般的な気象の一種である霧は、現実世界、特に山岳地帯で頻繁に発生するため、周囲の環境を正確に観察することは困難です。したがって、霧

arXiv

CNN

arXiv reaDer

estimation

dataset
リンク
画像圧縮のための暗黙の神経表現
arxiv_reader 2021/12/09
最近、暗黙の神経表現（INR）が、さまざまなデータ型の斬新で効果的な表現として注目を集めています。これまでのところ、以前の作業は主に再構築パフォーマンスの最適化に焦点を当てていました。この作品は、新し

quantization

representation

compression

attention

reconstruction

arXiv reaDer

arXiv

gradient
リンク
スケッチとランダム特徴によるニューラルタンジェントカーネルのスケーリング
arxiv_reader 2021/12/09
ニューラルタンジェントカーネル（NTK）は、勾配降下法による最小二乗損失の下でトレーニングされた無限幅のニューラルネットワークの動作を特徴づけます。最近の研究では、NTK回帰が小規模データセットでトレ

learning

approximation

gradient

classification

arXiv reaDer

dataset

convolutional

arXiv

benchmark
リンク
制約のないフェイスマスクおよびフェイスハンドデータセット：COVID-19の感染を防ぐのに役立つコンピュータービジョンシステムの構築
arxiv_reader 2021/12/09
保健機関は、コロナウイルスの蔓延を防ぐために、社会的距離を置き、フェイスマスクを着用し、顔に触れないようにすることを勧めています。これらの保護対策に基づいて、COVID-19の感染を防ぐためのコンピュ

detection

adaptation

COVID-19

face

arXiv reaDer

dataset

arXiv

computer vision
リンク
マルチエポックの過去の航空写真の機能マッチング
arxiv_reader 2021/12/09
歴史的画像は、高い空間分解能と立体的な取得によって特徴付けられ、3D土地被覆情報を回復するための貴重なリソースを提供します。自己較正による通時的な履歴画像の正確な地理参照は、進化する風景の下で十分な量

3D

arXiv

arXiv reaDer
リンク
Providentia-自動運転車の支援とその評価のための大規模センサーシステム
arxiv_reader 2021/12/09
自動運転車の環境認識は、物理センサーの範囲とアルゴリズムのパフォーマンス、および進行中の交通状況の理解を低下させるオクルージョンによって制限されます。これは、安全性に重大な脅威をもたらし、運転速度を制

occlusion

vehicle

arXiv reaDer

arXiv

pose
リンク
非常に詳細な画像の超解像のためのベストバディGAN
arxiv_reader 2021/12/09
低解像度（LR）入力に基づいて高解像度（HR）画像が生成される単一画像超解像（SISR）問題を検討します。最近、生成的敵対的ネットワーク（GAN）が、詳細を幻覚化するために人気が高まっています。この方

super-resolution

GAN

learning

arXiv reaDer

dataset

arXiv
リンク
敵対的例は、教師なし機械学習のための効果的なデータ拡張である可能性があります
arxiv_reader 2021/12/09
回避予測を引き起こす敵対的な例は、機械学習モデルの堅牢性を評価および改善するために広く使用されています。ただし、現在の研究は、教師あり学習タスクに焦点を当てており、グラウンドトゥルースデータラベル、対

unsupervised

augmentation

contrastive learning

adversarial

reconstruction

arXiv reaDer

representation learning

dataset

arXiv
リンク
DanceFormer：パラメトリックモーショントランスフォーマーを使用した音楽調整済み3Dダンス生成
arxiv_reader 2021/12/09
音楽から3Dダンスを生成することは、視覚やグラフィックスの多くのアプリケーションに利益をもたらす新たな研究課題です。以前の作品では、このタスクをシーケンス生成として扱っていましたが、運動学的に複雑で一

transformer

adaptation

reconstruction

arXiv reaDer

3D

dataset

arXiv

pose
リンク
SimulSLT：エンドツーエンドの同時手話翻訳
arxiv_reader 2021/12/09
社会的に重要な技術の一種としての手話翻訳は、近年、研究者の関心を高めています。ただし、既存の手話翻訳方法では、翻訳を開始する前にすべてのビデオを読み取る必要があります。これにより、推論の待ち時間が長く

video

dataset

arXiv

arXiv reaDer
リンク
きめ細かい認識のためのモバイルネットワークにおけるプログレッシブマルチステージインタラクティブトレーニング
arxiv_reader 2021/12/09
きめ細かい視覚分類（FGVC）は、サブカテゴリからオブジェクトを識別することを目的としています。クラス間の微妙な違いのため、これは非常に困難な作業です。既存の研究では、特徴抽出器として大規模な畳み込み

transformer

CNN

classification

arXiv reaDer

arXiv

benchmark
リンク
分類-その後の接地：ビデオシーングラフを時間的2部グラフとして再定式化する
arxiv_reader 2021/12/09
今日のVidSGGモデルはすべてプロポーザルベースの方法です。つまり、最初にプロポーザルとして多数のペアの主語-目的語スニペットを生成し、次に各プロポーザルの述語分類を実行します。このホワイトペーパー

arXiv reaDer

video

classification

localization

dataset

arXiv
リンク
自己監視モデルは継続的な学習者です
arxiv_reader 2021/12/09
自己監視モデルは、ラベルのないデータを大規模にオフラインでトレーニングした場合、監視モデルと同等またはそれ以上の視覚的表現を生成することが示されています。ただし、データがモデルに順次提示される継続学習

distillation

self-supervised

loss function

arXiv reaDer

representation learning

arXiv
リンク
歩行者は注意を払っていますか？野生のアイコンタクト検出
arxiv_reader 2021/12/09
都市または混雑した環境では、人間は近くの人々との迅速かつ効率的なコミュニケーションのためにアイコンタクトに依存しています。自律エージェントはまた、歩行者と対話し、歩行者の周りを安全にナビゲートするため

detection

representation

dataset

domain adaptation

vehicle

arXiv reaDer

keypoint

pedestrian

arXiv
リンク
敵対的なパラメトリックポーズの事前
Skinned Multi-Person Linear（SMPL）モデルは、ポーズと形状のパラメーターをボディメッシュにマッピングすることにより、人体を表すことができます。これは、さまざまな学習モデルを介して画像から3D人間のポーズと形状を推測するのを容易にすることが示されています。ただし、すべてのポーズと形状のパラメータ値が、物理的に妥当な、または現実的なボディメッシュを生成するわけではありません。言い換えると、SMPLは制約が不十分であるため、パラメータを直接最適化するか、画像からこれらのパラメータへのマッピングを学習することにより、画像から人間を再構築するために使用すると、無効な結果につながる可能性があります。したがって、この論文では、SMPLパラメータを敵対的なトレーニングを介して現実的なポーズを生成する値に制限する事前確率を学習します。学習した事前情報が実データ分布の多様性をカバ
arxiv_reader 2021/12/09
Skinned Multi-Person Linear（SMPL）モデルは、ポーズと形状のパラメーターをボディメッシュにマッピングすることにより、人体を表すことができます。これは、さまざまな学習モデル

human

mesh

adversarial

SMPL

reconstruction

arXiv reaDer

3D

keypoint

arXiv

pose
リンク
歴史的文書における共同手書きと固有表現抽出のためのTransformerベースのアプローチ
arxiv_reader 2021/12/09
手書き文書で指定されたエンティティによって実行される関連情報の抽出は、依然として困難な作業です。通常、テキストの転記と固有表現抽出に別々の後続タスクとして直面する従来の情報抽出アプローチとは異なり、こ

transformer

segmentation

learning

face

arXiv reaDer

arXiv
リンク
MogFace：顔検出のより深い理解に向けて
arxiv_reader 2021/12/09
汎用オブジェクト検出器の先駆的な設計の恩恵を受けて、顔検出の分野で大きな成果が得られました。通常、顔検出器内のバックボーン、特徴ピラミッド層、および検出ヘッドモジュールのアーキテクチャはすべて、一般的

detection

augmentation

face

bias

arXiv reaDer

arXiv
リンク
Transformaly-2つの（機能スペース）は1つよりも優れています
arxiv_reader 2021/12/09
異常検出は、所定の分布外のサンプルを特定しようとする確立された研究分野です。異常検出パイプラインは、（1）特徴抽出と（2）正規性スコアの割り当てという2つの主要な段階で構成されています。最近の論文では

anomaly detection

transformer

representation

pre-training

arXiv reaDer

arXiv
リンク
T-LEAP：時間情報を使用した歩行牛の閉塞ロバストポーズ推定
arxiv_reader 2021/12/09
酪農場の牛群の規模が拡大し続けるにつれて、牛の自動健康監視への関心が高まっています。乳牛によく見られる健康障害である跛行は、一般的に牛の歩行を分析することによって検出されます。モデルは画像やビデオの解

arXiv reaDer

occlusion

pose estimation

video

localization

landmark

keypoint

arXiv
リンク
マルチモーダルトレーニングによるユニモーダル顔分類
arxiv_reader 2021/12/09
顔認識は、セキュリティチェック、資格情報アクセス、モーションセンシングゲームなどのさまざまなマルチメディアアプリケーションで重要なタスクです。ただし、入力面にノイズが多い場合（たとえば、状態の悪いRG

embedding

mesh

point cloud

face recognition

classification

arXiv reaDer

3D

dataset

arXiv
リンク
効率的なスケルトンベースのアクション認識のためのトポロジー認識畳み込みニューラルネットワーク
arxiv_reader 2021/12/09
スケルトンベースのアクション認識のコンテキストでは、グラフ畳み込みネットワーク（GCN）が急速に開発されましたが、畳み込みニューラルネットワーク（CNN）はあまり注目されていません。 1つの理由は、C

action recognition

augmentation

CNN

attention

arXiv reaDer

GCN

dataset

arXiv
リンク
VISOLO：効率的なオンラインビデオインスタンスセグメンテーションのためのグリッドベースの時空間集約
arxiv_reader 2021/12/09
オンラインビデオインスタンスセグメンテーション（VIS）の場合、リアルタイムアプリケーションでは、前のフレームの情報を効率的に十分に活用することが不可欠です。以前のほとんどの方法は、RPNやRoIAl

real time

video

segmentation

representation

arXiv reaDer

dataset

convolutional

arXiv
リンク
関係知識の蒸留による対照学習の促進
arxiv_reader 2021/12/09
自己監視あり表現学習（SSL）は大規模モデルで効果的であることが証明されていますが、同じソリューションに従う場合、軽量モデルではSSLと監視あり方法の間に大きなギャップがあります。この問題を詳しく調べ

knowledge distillation

contrastive learning

self-supervised

arXiv reaDer

representation learning

arXiv
リンク
行列値のエッジを持つグラフの最短経路：概念、アルゴリズム、および3Dマルチシェイプ分析への適用
arxiv_reader 2021/12/09
グラフで最短経路を見つけることは、画像のセグメンテーション、形状のマッチング、離散表面上の測地線距離の計算など、コンピュータービジョンとグラフィックスの多くの問題に関連しています。従来、最短パスの概念

segmentation

arXiv reaDer

3D

arXiv

computer vision
リンク
参照ガイド画像合成における単一画像の評価
arxiv_reader 2021/12/09
Generative Adversarial Networks（GAN）のパフォーマンスの評価は、その実用的な重要性から重要なトピックとなっています。いくつかの評価指標が提案されていますが、それらは一

metric

human

arXiv reaDer

GAN

synthesis

unsupervised

contrastive

dataset

arXiv
リンク
ディープネットワークによる対称性の認識：フィードフォワードアーキテクチャの不十分さと反復接続による改善
arxiv_reader 2021/12/09
対称性は、自然界に遍在し、多くの種の視覚系によって認識されます。これは、環境内の生態学的に重要なクラスのオブジェクトの検出を容易にするためです。対称性の知覚は、画像領域間の非局所的な空間依存性の抽象化

human

learning

recurrent

DNN

arXiv reaDer

convolutional

arXiv
リンク
Garment4D：点群シーケンスからの衣服の再構築
arxiv_reader 2021/12/09
3D衣服を再構築することを学ぶことは、さまざまな形の3D人体をさまざまなポーズで着飾るために重要です。以前の作品は通常、入力として2D画像に依存していますが、スケールとポーズのあいまいさがあります。

human

point cloud

transformer

reconstruction

arXiv reaDer

estimation

3D

convolutional

arXiv

pose
リンク
SNEAK：自然言語のビデオローカリゼーションに対する同義の文を意識した敵対的攻撃
arxiv_reader 2021/12/09
自然言語ビデオローカリゼーション（NLVL）は、視覚言語理解の分野における重要なタスクであり、コンピュータービジョンと自然言語の側面だけでなく、さらに重要なことに、両者間の相互作用を深く理解する必要が

arXiv reaDer

video

adversarial

localization

arXiv

computer vision
リンク
AMMASurv：スライド全体の画像と遺伝子発現データを使用した正確な生存分析のための非対称マルチモーダル注意
arxiv_reader 2021/12/09
スライド全体の画像（WSI）と遺伝子発現データの組み合わせなどのマルチモーダルデータを生存分析に使用すると、より正確な生存予測につながる可能性があります。以前のマルチモーダル生存モデルでは、各モダリテ

attention

arXiv

arXiv reaDer
リンク
BA-Net：深い畳み込みニューラルネットワークに対するブリッジの注目
arxiv_reader 2021/12/09
近年、チャネル注意メカニズムは、深い畳み込みニューラルネットワーク（CNN）のパフォーマンスを改善する大きな可能性について広く研究されています。ただし、ほとんどの既存の方法では、チャネルの重みを計算す

CNN

attention

arXiv

arXiv reaDer
リンク
ニューラルポイント：ニューラルフィールドを使用した点群表現
本論文では、新しい点群表現であるニューラルポイントを提案する。各ポイントが3D空間内の位置またはローカル平面のみを表す従来のポイントクラウド表現とは異なり、ニューラルポイントの各ポイントは、ニューラルフィールドを介してローカルの連続した幾何学的形状を表します。したがって、ニューラルポイントは、はるかに複雑な詳細を表現できるため、より強力な表現能力を備えています。ニューラルポイントは、豊富な幾何学的詳細を含む高解像度のサーフェスでトレーニングされているため、トレーニングされたモデルはさまざまな形状に対して十分な表現能力を備えています。具体的には、ポイント上の深い局所的な特徴を抽出し、2Dパラメトリックドメインと3D局所パッチの間の局所同型を介して神経場を構築します。最後に、ローカルニューラルフィールドが統合されてグローバルサーフェスが形成されます。実験結果は、ニューラルポイントが強力な表現能
arxiv_reader 2021/12/09
本論文では、新しい点群表現であるニューラルポイントを提案する。各ポイントが3D空間内の位置またはローカル平面のみを表す従来のポイントクラウド表現とは異なり、ニューラルポイントの各ポイントは、ニューラル

point cloud

representation

domain

arXiv reaDer

3D

arXiv
リンク
単眼3Dオブジェクト検出：外因性パラメータフリーアプローチ
arxiv_reader 2021/12/09
単眼3Dオブジェクト検出は、自動運転における重要なタスクです。地面にエゴカーのポーズ変更が存在する場合は、簡単に扱いにくい場合があります。これは、道路の滑らかさと傾斜のわずかな変動のために一般的です。

monocular

autonomous driving

detection

arXiv reaDer

3D

dataset

arXiv

pose
リンク
対照的な指導-視覚のための軌道学習-言語ナビゲーション
arxiv_reader 2021/12/09
視覚言語ナビゲーション（VLN）タスクでは、エージェントが自然言語の指導を受けてターゲットに到達する必要があります。以前の作品は、指示に従って段階的にナビゲートすることを学びます。ただし、これらの作業

trajectory

representation

contrastive learning

bias

arXiv reaDer

arXiv
リンク
継続学習=壊滅的な忘却？
arxiv_reader 2021/12/09
継続的な学習は、壊滅的な忘却に苦しむことで知られています。これは、以前に学習した概念が、より最近のサンプルを犠牲にして忘れられる現象です。この作業では、継続的な学習が必然的に壊滅的な忘却と関連している

reconstruction

classification

pre-training

arXiv reaDer

representation learning

3D

dataset

arXiv
リンク
全微分近似と加速勾配降下法を使用した逆画像フィルタリング
arxiv_reader 2021/12/09
この論文では、線形または非線形の画像フィルターの効果を逆転させるという新しい問題に取り組みます。フィルタのアルゴリズムは不明であり、フィルタはブラックボックスとして使用可能であると想定されています。こ

approximation

domain

arXiv reaDer

arXiv

gradient
リンク
生成的敵対的ネットワークのための特徴統計混合正則化
arxiv_reader 2021/12/09
生成的敵対的ネットワークでは、弁別子の改善は生成パフォーマンスの重要な要素の1つです。画像分類器はテクスチャに偏っており、バイアスを取り除くと精度が向上するため、1）弁別子に偏りがあるかどうか、2）弁

regularization

GAN

arXiv reaDer

dataset

arXiv
リンク
GANに変圧器を採用する際の要点
arxiv_reader 2021/12/09
Transformerは、コンピュータービジョン、特に高レベルのビジョンタスクで普及しています。ただし、生成的敵対的ネットワーク（GAN）フレームワークにTransformerを採用することは、未解決

GAN

synthesis

transformer

residual

CNN

learning

classification

arXiv reaDer

arXiv

computer vision
リンク
セマンティックセグメンテーションのための完全に注意深いネットワーク
arxiv_reader 2021/12/09
最近の非局所的自己注意法は、セマンティックセグメンテーションの長距離依存関係をキャプチャするのに効果的であることが証明されています。これらの方法は通常、RC * C（空間次元の圧縮による）またはRHW

semantic segmentation

attention

arXiv reaDer

dataset

arXiv
リンク
学習したセマンティックピラミッドを使用した完全なコンテキストアウェア画像の修復
arxiv_reader 2021/12/09
画像内の任意の欠落領域に対して合理的で現実的なコンテンツを復元することは、重要でありながら困難な作業です。最近の画像修復モデルは、鮮明な視覚的詳細の生成において大きな進歩を遂げましたが、より複雑なシー

representation

learning

arXiv reaDer

dataset

arXiv
リンク
前庭神経鞘腫および蝸牛セグメンテーションのための対照的な対になっていない画像翻訳のためのすぐに使えるフレームワークの使用：crossMoDAチャレンジへのアプローチ
arxiv_reader 2021/12/09
この調査の目的は、crossMoDAチャレンジにすぐに使用できるディープラーニングフレームワークを適用して評価することです。造影剤増強T1MRから高解像度T2MRへのドメイン適応のために、パッチワイズ

augmentation

segmentation

contrastive learning

adversarial

domain adaptation

arXiv reaDer

arXiv
リンク
2つの結合された拒否メトリックは敵対的な例を区別することができます
arxiv_reader 2021/12/09
敵対的な例を正しく分類することは、機械学習モデルを安全に展開するために不可欠ですが、難しい要件です。 RobustBenchで報告されているように、最先端の敵対的に訓練されたモデルでさえ、CIFAR-

metric

learning

adversarial

arXiv reaDer

arXiv
リンク
CDLNet：ブラインドノイズ除去およびデモザイキングのためのノイズ適応畳み込み辞書学習ネットワーク
arxiv_reader 2021/12/09
ディープラーニングベースの方法は、低レベルの画像処理タスクで最先端の結果を保持しますが、ブラックボックス構造のために解釈が難しいままです。展開された最適化ネットワークは、標準の深層学習ツールボックスの

arXiv reaDer

learning

denoising

unsupervised

convolutional

arXiv
リンク
CLIP-It！言語ガイド付きビデオ要約
arxiv_reader 2021/12/09
一般的な動画の概要は、ストーリー全体を伝え、最も重要なシーンを取り上げた動画の要約版です。ただし、動画のシーンの重要性は主観的なものであることが多く、ユーザーは自然言語を使用して要約をカスタマイズし、

arXiv reaDer

transformer

video

saliency

unsupervised

dataset

arXiv
リンク
PLAD：疑似ラベルと近似分布を使用して形状プログラムを推測する方法を学ぶ
arxiv_reader 2021/12/09
2Dおよび3D形状を生成するプログラムを推測することは、リバースエンジニアリングや編集などにとって重要です。ペア（形状、プログラム）データは多くのドメインですぐに利用できないため、このタスクを実行する

reinforcement learning

domain

generative

arXiv reaDer

3D

arXiv

gradient
リンク
DISN：高品質のシングルビュー3D再構成のための深陰関数曲面ネットワーク
arxiv_reader 2021/12/09
シングルビュー画像から3D形状を再構築することは、長年の研究課題でした。この論文では、基礎となる符号付き距離フィールドを予測することにより、2D画像から高品質の詳細な3Dメッシュを生成できるDeep

mesh

synthesis

reconstruction

arXiv reaDer

3D

arXiv
リンク
ニューラルガイド付き形状パーサー：近似推論による3D形状領域の文法ベースのラベリング
arxiv_reader 2021/12/09
3D形状の領域にきめの細かいセマンティックラベルを割り当てる方法を学習する方法であるNeurally-GuidedShape Parser（NGSP）を提案します。 NGSPは、MAP推論を介してこの

3D

arXiv

semantic segmentation

arXiv reaDer
リンク
GreenPCO：教師なし軽量点群オドメトリ法
arxiv_reader 2021/12/09
視覚オドメトリは、視覚センサーによってキャプチャされた情報を使用して、オブジェクトの増分モーションを追跡することを目的としています。この作業では、LiDAR（Light Detection And R

odometry

unsupervised

detection

point cloud

trajectory

learning

LiDAR

arXiv reaDer

dataset

arXiv
リンク
異なるV1脳モデルバリアントを組み合わせて、CNNの画像破損に対するロバスト性を向上させる
arxiv_reader 2021/12/09
一部の畳み込みニューラルネットワーク（CNN）は、オブジェクト分類において人間の視覚能力を上回っていますが、さまざまなタイプの一般的なノイズパターンで破損した画像内のオブジェクトを認識するのに苦労する

human

distillation

CNN

classification

arXiv reaDer

arXiv
リンク
悪意のあるディープフェイクへの対抗：調査、戦場、地平線
arxiv_reader 2021/12/09
DeepFakeとして知られる深い生成的アプローチによる顔の外観の作成または操作は、大きな進歩を遂げ、映画の視覚効果の支援や有名人を偽造することによる誤った情報の生成など、さまざまな良性および悪意のあ

detection

deepfake

face

generative

arXiv reaDer

arXiv

pose
リンク
ADAS向けのビジョンクラウドデータフュージョン：車線変更予測のケーススタディ
arxiv_reader 2021/12/09
インテリジェント車両と先進運転支援システム（ADAS）の急速な発展に伴い、新しい傾向として、さまざまなレベルの人間のドライバーの関与が輸送システムに関与するようになります。したがって、潜在的なリスクを

human

detection

simulation

vehicle

arXiv reaDer

arXiv
リンク
少数のショットの一人称行動認識のためのドメイン固有の事前確率とメタ学習
arxiv_reader 2021/12/09
注釈付きの大規模な実際のデータセットがないため、ビデオアクティビティを理解するために転移学習が必要になります。私たちは、一人称行動分類のための数ショット伝達学習のための効果的な方法を開発することを目指

action recognition

activity

representation

domain

few-shot

classification

arXiv reaDer

transfer learning

dataset

arXiv
リンク
視線追跡と瞳孔ダイナミックに基づくプレゼンテーション攻撃検出方法：包括的な調査
arxiv_reader 2021/12/09
研究の目的：生体認証コミュニティでは、目に見える人間の特性が人気があり、モバイルデバイスでの検証と識別に実行可能です。ただし、詐欺師は、システムをだますために偽の生体認証や人工生体認証を作成することで

human

detection

arXiv

gaze

arXiv reaDer

identification

tracking

biometrics
リンク
画像分類器は、小さな摂動に対してロバストにすることはできません
arxiv_reader 2021/12/09
入力の小さな摂動に対する画像分類器の感度は、多くの場合、それらの構造の欠陥と見なされます。この感度が分類器の基本的な特性であることを示します。 n行n列の画像のセットに対する任意の分類器について、1つ

human

classification

arXiv reaDer

arXiv

computer vision
リンク
7Tでの定量的R1マッピングにおけるスキャン間モーションアーティファクトの修正
arxiv_reader 2021/12/09
目的：スキャン間モーションは、R_1推定のエラーの実質的な原因であり、B_1フィールドがより不均一である7Tで増加すると予想できます。確立された補正スキームは、ボディコイルリファレンスを必要とするため

generative

arXiv reaDer

estimation

dataset

arXiv
リンク
予測情報で入力特徴を特定することによるきめ細かいニューラルネットワークの説明
arxiv_reader 2021/12/09
ブラックボックスニューラルネットワークを照らすための1つの主要なアプローチは、特徴の帰属、つまりネットワークの予測のための入力特徴の重要性を特定することです。特徴の予測情報は、それらの重要性の尺度の代

domain

identification

arXiv

arXiv reaDer
リンク
表面欠陥検出のためのロバストな完成ローカルバイナリパターン（RCLBP）
arxiv_reader 2021/12/09
この論文では、表面欠陥検出タスクのためのロバストな完成ローカルバイナリパターン（RCLBP）フレームワークを紹介します。私たちのアプローチは、ウェーブレットしきい値を使用した非ローカル（NL）手段フィ

denoising

detection

arXiv

arXiv reaDer
リンク
DeepFace-EMD：パッチごとのEarth Moverの距離を使用した再ランク付けにより、分布外の顔識別が改善されます
arxiv_reader 2021/12/09
顔識別（FI）はいたるところにあり、法執行機関による多くの重要な決定を推進します。最先端のFIアプローチでは、画像の埋め込み間の余弦の類似性を取得することにより、2つの画像を比較します。しかし、そのよ

embedding

occlusion

face

adversarial

arXiv reaDer

OOD

identification

arXiv
リンク
神経活性化コーディングによる教師なし表現学習
arxiv_reader 2021/12/09
ダウンストリームアプリケーションのラベルなしデータから深い表現を学習するための新しいアプローチとして、神経活性化コーディング（NAC）を紹介します。ディープエンコーダーは、その表現力を最大限に活用する

arXiv reaDer

generative

classification

unsupervised

representation learning

arXiv
リンク
類似性に基づく知識蒸留による自己監視ビデオ表現のための補助学習
arxiv_reader 2021/12/09
ビデオ表現学習のための自己監視型事前トレーニング方法の目覚ましい成功にもかかわらず、事前トレーニング用のラベルなしデータセットが小さい場合、またはソースタスク（事前トレーニング）のラベルなしデータとタ

video

knowledge distillation

domain

self-supervised

arXiv reaDer

representation learning

dataset

arXiv
リンク
ローカルビューとグローバルビューを使用したディープラーニングを使用した組織病理学画像の核セグメンテーション
arxiv_reader 2021/12/09
デジタルパソロジーは、現代医学における最も重要な発展の1つです。病理学的検査は医療プロトコルのゴールドスタンダードであり、診断において基本的な役割を果たします。最近、デジタルスキャナーの出現により、組

detection

segmentation

learning

arXiv reaDer

dataset

arXiv
リンク
軽量アクション認識のためのトランスフォーマーの評価
arxiv_reader 2021/12/09
ビデオアクション認識では、トランスフォーマーは常に最先端の精度に到達します。ただし、多くのモデルは、ハードウェアリソースが限られている平均的な研究者には重すぎます。この作業では、軽量アクション認識のた

transformer

action recognition

video

attention

arXiv reaDer

dataset

convolutional

arXiv

benchmark
リンク
NucMMデータセット：サブキュービックミリメートルスケールでの3Dニューロン核インスタンスのセグメンテーション
arxiv_reader 2021/12/09
顕微鏡画像ボリュームから3D細胞核をセグメント化することは、生物学的および臨床的分析にとって重要であり、細胞発現パターンおよび細胞系統の研究を可能にします。ただし、神経核の現在のデータセットには通常、

segmentation

arXiv reaDer

representation learning

3D

dataset

arXiv

benchmark
リンク
MEDIC：災害画像分類のためのマルチタスク学習データセット
arxiv_reader 2021/12/09
災害情報学の最近の研究は、ソーシャルメディアコンテンツ（テキストと画像）に基づいて、自然災害後の人命と苦痛を救うための人工知能の実用的で重要なユースケースを示しています。テキストを使用して目覚ましい進

human

multi-task

learning

classification

arXiv reaDer

dataset

arXiv
リンク
スパースグラフに沿った少数のショット画像分類
arxiv_reader 2021/12/09
ほとんどの実世界のデータでは1ショットの精度が不十分であるため、数ショットの学習は依然として困難な問題です。ここでは、ディープネットワークの機能空間におけるデータ分散のさまざまな視点を示し、それを数シ

sparse

learning

few-shot

reconstruction

classification

arXiv reaDer

dataset

arXiv
リンク
CTスキャンでの銃検出のためのスケーラブルな3Dセマンティックセグメンテーション
Scala ble 3D Semantic Segmentation for Gun Detection in CT Scans 3Dデータの可用性が高まるにつれ、それらを処理するソリューションの必要性も急速に高まりました。ただし、すでに確実に正確な2Dアプローチに次元を追加すると、膨大なメモリ消費と計算の複雑さが増します。これらの問題により、現在のハードウェアは限界に達し、ほとんどの方法で入力解像度を大幅に下げる必要があります。私たちの主な貢献は、手荷物CTスキャンでの銃の検出のための新しいディープ3Dセマンティックセグメンテーション手法であり、高解像度のボクセル化されたボリュームの高速トレーニングと低ビデオメモリ消費を可能にします。インスタンスをセグメント化するために推論時に複数のフォワードパスを利用する移動ピラミッドアプローチを紹介します。 With the increased ava
arxiv_reader 2021/12/09
3Dデータの可用性が高まるにつれ、それらを処理するソリューションの必要性も急速に高まりました。ただし、すでに確実に正確な2Dアプローチに次元を追加すると、膨大なメモリ消費と計算の複雑さが増します。これ

detection

video

semantic segmentation

CT

arXiv reaDer

3D

arXiv
リンク
BT-Unet：U-NetモデルでBarlowTwinsを使用した生物医学画像セグメンテーションのための自己監視学習フレームワーク
arxiv_reader 2021/12/09
ディープラーニングは、医用画像の描写プロセスを自動化するための生物医学画像のセグメンテーションに最も大きな貢献をもたらしました。このようなタスクを実行するには、バイナリマスクを使用して関心領域を強調表

metric

unsupervised

segmentation

U-Net

representation

self-supervised

arXiv reaDer

dataset

arXiv
リンク
画像レジストレーションネットワークへの勾配ベースの最適化の組み込み
arxiv_reader 2021/12/09
深層学習フレームワークに勾配ベースの反復エネルギー最小化を組み込むことにより、変形可能な画像レジストレーションを学習するための勾配降下ベースの画像レジストレーションネットワーク（GraDIRN）を紹介

regularization

embedding

metric

CNN

learning

MRI

reconstruction

arXiv reaDer

3D

arXiv
リンク
数ショットの医療ランドマーク検出のためにラベルを付ける画像はどれですか？
arxiv_reader 2021/12/09
ディープラーニング手法の成功は、適切にラベル付けされた大規模データセットの可用性に依存しています。ただし、医用画像の場合、このような豊富なトレーニングデータに注釈を付けるには、経験豊富な放射線科医が必

detection

one-shot

few-shot

self-supervised

pre-training

arXiv reaDer

estimation

landmark

dataset

arXiv
リンク
fNIRSハイパースキャンデータを使用した二者間性比とタスク分類
arxiv_reader 2021/12/09
機能的近赤外分光法（fNIRS）を使用したハイパースキャンは、社会的相互作用の根底にある微妙な神経署名を測定する新しいニューロイメージングアプリケーションです。研究者は、人間同士の相互作用の間の脳間の

CNN

classification

arXiv reaDer

dataset

arXiv
リンク
予測できないこと、理解できないこと：説明可能性手法のための人間中心の評価フレームワーク
What I Cannot Predict, I Do Not Understand: A Human-Centered Evaluation Framework for Explainability Methods 多数の説明可能性の方法と理論的評価スコアが提案されています。ただし、まだわかっていません。（1）これらの方法が実際のシナリオでどれほど有用であるか、および（2）理論的尺度が人間による実際の使用に対するこれらの方法の有用性をどれだけうまく予測するか。このギャップを埋めるために、人間の精神物理学実験を大規模に実施して、代表的な帰属方法を活用してさまざまな画像分類子の決定を予測することを学ぶ人間の参加者（n = 1,150）の能力を評価しました。私たちの結果は、説明可能性の方法をスコアリングするために使用される理論的尺度が、実際のシナリオにおける個々の帰属方法の実際的な有用性を十分
arxiv_reader 2021/12/09
多数の説明可能性の方法と理論的評価スコアが提案されています。ただし、まだわかっていません。（1）これらの方法が実際のシナリオでどれほど有用であるか、および（2）理論的尺度が人間による実際の使用に対する

human

dataset

arXiv

arXiv reaDer
リンク
自己監視型ビデオ表現学習のための正規化フローによる静的視覚的手がかりの抑制
arxiv_reader 2021/12/09
深い畳み込みニューラルネットワークによって行われたビデオ理解の大きな進歩にもかかわらず、既存の方法によって学習された特徴表現は、静的な視覚的手がかりに偏っている可能性があります。この問題に対処するため

video

CNN

contrastive learning

self-supervised

pre-training

bias

arXiv reaDer

representation learning

arXiv

benchmark
リンク
顕著性へのアクティベーション：完全に監視されていない顕著なオブジェクト検出のための高品質ラベルの形成
arxiv_reader 2021/12/09
教師なし顕著な物体検出（USOD）は、産業用アプリケーションとダウンストリームタスクの両方にとって最も重要です。既存の深層学習（DL）ベースのUSOD手法は、いくつかの従来のSOD手法によって抽出され

unsupervised

human

detection

residual

saliency

attention

loss function

arXiv reaDer

arXiv

benchmark
リンク
骨格ビデオ異常検出のための明示的分布モデリングによる規則性学習
arxiv_reader 2021/12/09
監視ビデオでの異常検出は、公共のセキュリティを確保するために困難で重要です。ピクセルベースの異常検出方法とは異なり、ポーズベースの方法は高度に構造化されたスケルトンデータを利用するため、計算負荷が軽減

anomaly detection

transformer

optical flow

representation

reconstruction

self-supervised

arXiv reaDer

dataset

arXiv

pose
リンク
CALVIN：長期的なロボット操作タスクのための言語条件付きポリシー学習のベンチマーク
arxiv_reader 2021/12/09
環境内で人間と共存する汎用ロボットは、日常のさまざまなタスクで役立つように、人間の言語を知覚や行動に関連付けることを学ぶ必要があります。さらに、彼らは、制約のない言語の指示に従うことによって、長期的な

action

human

zero-shot

learning

arXiv reaDer

dataset

robot

arXiv

benchmark
リンク
SITA：単一画像のテスト時間の適応
arxiv_reader 2021/12/09
Test-time Adaptation（TTA）では、いくつかのソースデータでトレーニングされたモデルが与えられた場合、目標は、異なる分布からのテストインスタンスのより良い予測を行うためにそれを適応

segmentation

adaptation

classification

arXiv reaDer

edge device

arXiv
リンク
U2-Former：画像復元用のネストされたU字型トランスフォーマー
arxiv_reader 2021/12/09
Transformerは、さまざまな高レベルの視覚タスクで優れたパフォーマンスを達成していますが、画像の復元でTransformerの可能性を最大限に活用することは依然として困難です。重要なのは、画像

transformer

representation

contrastive learning

arXiv reaDer

arXiv
リンク
原発腫瘍生検スライドでの深層学習を使用した早期乳がんにおける腋窩リンパ節転移の予測
arxiv_reader 2021/12/09
目的：臨床的に陰性のALNを有する早期乳がん（EBC）患者の術前に腋窩リンパ節（ALN）転移を予測するための深層学習（DL）ベースの原発腫瘍生検シグネチャーを開発および検証すること。方法：病理学的にA

learning

interpretation

arXiv reaDer

dataset

arXiv
リンク
あなたの賢い隣人に気をつけてください：適応クラスタリング関係モデリングによる教師なし人の再識別
arxiv_reader 2021/12/09
教師なしRe-ID（Re-ID）は、教師ありRe-IDモデルのスケーラビリティの問題を解決できる可能性があるため、ますます注目を集めています。ほとんどの既存の教師なし手法は、教師なしクラスタリングによ

unsupervised

contrastive learning

attention

re-id

arXiv reaDer

dataset

person

arXiv

clustering
リンク
ExCon：画像分類のための説明主導の教師あり対照学習
arxiv_reader 2021/12/09
対照的な学習により、画像分類などのタスクで学習された埋め込み表現の品質が大幅に向上しました。ただし、既存の対照的な拡張方法の主な欠点は、画像コンテンツの変更につながる可能性があり、そのセマンティクスに

adversarial

dataset

arXiv reaDer

contrastive learning

augmentation

arXiv

embedding

classification

representation
リンク
ドメイン適応のためのアクティブラーニング：エネルギーベースのアプローチ
arxiv_reader 2021/12/09
教師なしドメイン適応は、最近、ディープニューラルネットワークを新しいターゲットドメインに一般化するための効果的なパラダイムとして登場しました。ただし、完全に監視されたパフォーマンスに到達するために利用

regularization

benchmark

bias

arXiv reaDer

domain adaptation

learning

arXiv

unsupervised
リンク
反復コントラスト-半教師あり時間アクションセグメンテーションの分類
Iterative Contrast-Classify For Semi-supervised Temporal Action Segmentation 時間的アクションセグメンテーションは、各フレームのアクションを（長い）ビデオシーケンスに分類します。フレームごとのラベリングのコストが高いため、時間的アクションセグメンテーションのための最初の半教師あり方法を提案します。私たちの方法は、教師なし表現学習に依存します。これは、時間的アクションのセグメンテーションでは、固有の課題をもたらします。トリミングされていない動画のアクションは長さが異なり、ラベルと開始/終了時間が不明です。動画全体でのアクションの順序も異なる場合があります。時間近接条件と多重解像度類似性を追加して入力特徴をクラスタリングすることにより、時間畳み込みネットワーク（TCN）からフレーム単位の表現を学習する新しい方法を提案し
arxiv_reader 2021/12/09
時間的アクションセグメンテーションは、各フレームのアクションを（長い）ビデオシーケンスに分類します。フレームごとのラベリングのコストが高いため、時間的アクションセグメンテーションのための最初の半教師あ

convolutional

arXiv reaDer

segmentation

pose

semi-supervised

representation learning

arXiv

clustering

unsupervised
リンク
- 2021年12月10日
- 2021年12月9日
- 2021年12月8日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx