[B! distillation][reasoning] arxiv_readerのブックマーク

arxiv_reader id:arxiv_reader

distillationとreasoningに関するarxiv_readerのブックマーク (21)

https://arxiv-check-250201.firebaseapp.com/each/2312.17648v2
arxiv_reader 2024/07/09
distillation

reasoning

arXiv reaDer

domain

dataset

pre-training

arXiv
リンク
https://arxiv-check-250201.firebaseapp.com/each/2312.03052v2
arxiv_reader 2024/04/08
human

arXiv reaDer

reasoning

arXiv

adaptation

distillation
リンク
https://arxiv-check-250201.firebaseapp.com/each/2311.09612v2
arxiv_reader 2024/04/03
distillation

arXiv reaDer

benchmark

arXiv

reasoning
リンク
https://arxiv-check-250201.firebaseapp.com/each/2403.18795v2
arxiv_reader 2024/04/01
reconstruction

reasoning

distillation

regularization

3D

arXiv

arXiv reaDer

dataset
リンク
https://arxiv-check-250201.firebaseapp.com/each/2402.15832v2
arxiv_reader 2024/02/27
dataset

arXiv

arXiv reaDer

classification

learning

benchmark

reasoning
リンク
https://arxiv-check-250201.firebaseapp.com/each/2312.17648v1
arxiv_reader 2024/01/01
arXiv reaDer

arXiv

domain

reasoning

pre-training

distillation

dataset
リンク
https://arxiv-check-250201.firebaseapp.com/each/2312.03052v1
arxiv_reader 2023/12/07
distillation

human

adaptation

arXiv

reasoning

arXiv reaDer
リンク
https://arxiv-check-250201.firebaseapp.com/each/2311.09612v1
arxiv_reader 2023/11/17
benchmark

reasoning

distillation

arXiv reaDer

arXiv
リンク
クラス分布の不一致下での重みを意識した蒸留による半教師あり学習
arxiv_reader 2023/08/24
クラス分布不一致の下での半教師あり学習 (SSL) は、ラベルなしデータにラベル付きデータには見られない未知のカテゴリが多数含まれているという困難な問題に取り組むことを目的としています。このような不

reasoning

semi-supervised

contrastive

benchmark

dataset

arXiv reaDer

representation

unsupervised

arXiv

distillation
リンク
改善された視覚言語推論による CLIP の拡張
arxiv_reader 2023/07/31
CLIP などの画像とテキストの対比モデルは、ゼロショット分類、画像とテキストの検索、転移学習などのさまざまな下流アプリケーションに役立ちます。しかし、これらの対照的に訓練された視覚言語モデルは、W

contrastive

arXiv reaDer

zero-shot

distillation

classification

transfer learning

arXiv

benchmark

generative

reasoning
リンク
改善された視覚言語推論による CLIP の拡張
arxiv_reader 2023/07/19
CLIP などの画像とテキストの対比モデルは、ゼロショット分類、画像とテキストの検索、転移学習などのさまざまな下流アプリケーションに役立ちます。しかし、これらの対照的に訓練された視覚言語モデルは、W

arXiv reaDer

contrastive

classification

reasoning

transfer learning

zero-shot

distillation

arXiv

generative

benchmark
リンク
マルチモーダル固有表現認識およびマルチモーダル関係抽出のための思考連鎖プロンプト蒸留
arxiv_reader 2023/06/27
マルチモーダル固有表現認識 (MNER) とマルチモーダル関係抽出 (MRE) には、複雑な言語的およびマルチモーダルな理解を行うための基本的な推論能力が必要です。この研究では、一連の中間推論ステッ

dataset

arXiv

distillation

arXiv reaDer

reasoning
リンク
https://arxiv-check-250201.firebaseapp.com/each/2305.14093v3
arxiv_reader 2023/05/24
3D シーンのオープンボキャブラリーセグメンテーションは人間の知覚の基本的な機能であり、したがってコンピュータービジョン研究における重要な目的です。ただし、このタスクは、堅牢で一般化可能なモデルをトレ

reasoning

segmentation

arXiv

computer vision

3D

pre-training

human

dataset

arXiv reaDer
リンク
CLIP-FO3D: 2D Dense CLIP から無料のオープンワールド 3D シーン表現を学ぶ
arxiv_reader 2023/03/09
3D シーンを理解するモデルをトレーニングするには、人による複雑な注釈が必要です。これを収集するのは骨の折れる作業であり、その結果、近いセットのオブジェクトセマンティクスのみをエンコードするモデルに

benchmark

semantic segmentation

3D

zero-shot

arXiv

reasoning

distillation

arXiv reaDer

pre-training

point cloud
リンク
夜間の熱赤外線画像のカラー化のための記憶誘導共同注意
arxiv_reader 2022/08/08
夜間の熱赤外線 (NTIR) 画像のカラー化は、NTIR 画像を昼間のカラー画像に変換すること (NTIR2DC) としても知られ、人間やインテリジェントシステムが不利な条件下 (完全な暗闇など)

GAN

attention

detection

arXiv reaDer

reasoning

learning

gradient

arXiv

distillation
リンク
複数人の 3D 人体姿勢推定のための明示的オクルージョン推論
arxiv_reader 2022/08/02
オクルージョンは、オクルーダーの形状、外観、および位置に関して大きな変動性があるため、単眼の複数人の 3D 人間の姿勢推定に大きな脅威をもたらします。既存の方法は、ポーズの優先順位/制約、データ拡張、

benchmark

human pose estimation

augmentation

3D

distillation

detection

pose estimation

arXiv

reasoning

arXiv reaDer
リンク
一時的な文の接地のための視覚と言語のバイアスを減らす
arxiv_reader 2022/07/28
一時的な文の接地（TSG）は、マルチメディア情報検索において重要でありながら挑戦的なタスクです。以前のTSGメソッドはまともなパフォーマンスを達成しましたが、特にめったに出現しないペアに対して、堅牢な

bias

reasoning

arXiv reaDer

identification

contrastive

distillation

arXiv

representation

dataset

benchmark
リンク
CLIP-TD：視覚言語タスクのためのCLIPターゲット蒸留
arxiv_reader 2022/05/17
対照的な言語画像事前トレーニング（CLIP）は、視覚と言語モダリティを統合された埋め込みスペースにリンクし、視覚言語（VL）タスクの大きな可能性を生み出します。初期の並行作業では、タスクのサブセットで

arXiv

VQA

reasoning

domain

embedding

contrastive

arXiv reaDer

distillation
リンク
視覚言語タスクのためのユニモーダルエンコーダを活用するためのマルチモーダル適応蒸留
arxiv_reader 2022/04/25
視覚言語（VL）タスク用のクロスモーダルエンコーダーは、慎重にキュレートされた視覚言語データセットで事前にトレーニングされていることがよくあります。これらのデータセットは1,000万サンプルのオーダー

arXiv

arXiv reaDer

VQA

distillation

reasoning

domain

dataset
リンク
CLIP-TD：視覚言語タスクのためのCLIPターゲット蒸留
CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks 対照的な言語画像事前トレーニング（CLIP）は、視覚と言語モダリティを統合された埋め込みスペースにリンクし、視覚言語（VL）タスクの大きな可能性を生み出します。初期の並行作業では、タスクのサブセットでこの可能性の調査が開始されましたが、重要な質問が残っています。1）調査されていないVLタスクでのCLIPの利点は何ですか。 2）CLIPは、ローショットまたはドメインシフトのシナリオでメリットをもたらしますか？ 3）CLIPは、推論や事前トレーニングの複雑さに影響を与えることなく、既存のアプローチを改善できますか？この作業では、2つの重要な貢献を通じてこれらの質問に答えることを目指しています。最初に、さまざまなデータ可用性の制約とドメインシフトの条件にわたって、Visua
arxiv_reader 2022/01/19
対照的な言語画像事前トレーニング（CLIP）は、視覚と言語モダリティを統合された埋め込みスペースにリンクし、視覚言語（VL）タスクの大きな可能性を生み出します。初期の並行作業では、タスクのサブセットで

arXiv

arXiv reaDer

reasoning

distillation

contrastive

domain

VQA

embedding
リンク
1 2 次のページ

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx