タグ

2023年2月2日のブックマーク (3件)

  • Metaの自己教師あり学習モデルData2vecについて - Qiita

    はじめに 知識を得るために、この記事を書いてみた。 背景 現在の深層ニューラルネットワークが直面する課題 上の図を見ればわかると思うが、簡潔に解説すると、物体を識別するために設計されたアルゴリズムは、テキストなどの別のモダリティ (modality)に直接適用できない。テキスなどを解析するために設計されたアルゴリズムは、物体の認識には直接適応できない。 そこで、Data2vecの誕生により、前述の問題を解消できる。 ※モダリティ (modality)とは、話している内容や聞き手に対する話し手の判断や態度(attitude)に関する言語表現の概念体系である。例えば、「きっと雨が降るだろう」という文では、「雨が降る」ということに対する話し手の推測が「きっと~だろう」によって表されているので、この部分がモダリティ形式であるといえる。モダリティには「きっと~だろう」で表されるような事柄に対する対事

    Metaの自己教師あり学習モデルData2vecについて - Qiita
  • 画像・言語・音声のすべてに対応する、初の高性能な自己教師あり学習であるdata2vecを紹介!

    画像・言語・音声のすべてに対応する、初の高性能な自己教師あり学習であるdata2vecを紹介! 2022.02.28 レポート 画像処理, 自然言語処理 概要 データをアノテーションする労力を回避するために、教師あり学習のようにコンピュータがラベル付けされた画像、テキスト、音声、その他のデータソースを通じて明示的に教えるのではなく、環境を直接観察することによって学習する自己教師あり学習は、AIの多くの重要な最近の進歩を後押ししています。しかしながら、人は情報の取得方法(たとえば、視覚または音声のどちらを使用するか)に関係なく、同様の方法で学習しているように見えますが、現在、教師あり学習アルゴリズムが画像、音声、テキストや他のモダリティから学習する方法とは大きな違いがあります。(モダリティ (modality)とは、一般的には話している内容に対する話し手の判断や感じ方を表す言語表現のことです

    画像・言語・音声のすべてに対応する、初の高性能な自己教師あり学習であるdata2vecを紹介!
  • メタの自己教師あり学習モデルは「1つですべて兼ねる」への一歩か

    メタの研究者は音声、画像、テキストを処理できる単一のAIモデルを訓練したと発表した。このマルチモーダルシステムが将来的に同社の拡張現実やメタバース製品を動かすことが期待されている。 このモデルは「data2vec」と呼ばれ、さまざまなタスクを実行できる。多くの機械は、ラベル付きのデータからのみ学習する。しかし、自己教師あり学習により、機械は世界を観察するだけで、画像、音声、テキストの構造を把握して学習することができる 「これは、より多くの音声言語のテキストを理解するなど、機械が新しい複雑なタスクに取り組むための、よりスケーラブルで効率的なアプローチだ」とメタの研究者は語っている。 AIのアルゴリズムは通常、1種類のデータで学習するが、data2vecは3つの異なるモダリティで学習する。ただし、音声、画像、テキストなど、それぞれの形式を個別に処理することに変わりはない。 メタは、このようなマ

    メタの自己教師あり学習モデルは「1つですべて兼ねる」への一歩か