タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

deeplearningに関するtuxedokatzeのブックマーク (2)

  • AI開発の新たなパラダイム「基盤モデル」とは

    さて、視覚・言語を扱う基盤モデルとしては、2021年の CLIP がブレイクスルーでした。CLIPはテキストと画像を同じ特徴空間に写像する2つのエンコーダからなります。CLIPを使うと、次のようにして任意の画像分類問題を追加の学習なしで解くことができます。まず、各候補クラスを文章の形式(例:「犬の写真」)にした後、テキストエンコーダに入力します。次に、分類したい画像を画像エンコーダに入力します。最後に、画像から得られたベクトルと候補クラスたちから得られた複数のベクトルとのコサイン類似度を計算し、最も類似度が高いクラスを出力結果とします。 CLIPによるゼロショット画像分類の方法。OpenAI Blogより引用 CLIPは画像とテキストというモードの異なる情報を意味的な近さによって結びつけることを可能にしました。CLIPを教師のようにして使うことで、テキストから画像を生成するモデルを訓練する

    AI開発の新たなパラダイム「基盤モデル」とは
  • 有名なDeep Learningの特許を調べてみた - arutema47's blog

    目的 有名所のDNN特許を調べてみました。ほとんどがGoogleの特許ですがBatchNorm、transformer以外日で登録されていないのが多いですね。 調べたところで力尽きてちゃんとクレームはトップ以外読んでません。随時リストはアップデートしていきます。 参考: https://www.reddit.com/r/MachineLearning/comments/c5mdm5/d_googles_patent_on_dropout_just_went_active_today/www.reddit.com 感想 Dropout,Batchnorm,transformerなど根幹特許を多くGoogleに抑えられていますが、基的にはPatent Trollに対しての防衛でGoogleから権利行使することはないようです。(訴訟は今の所ない) 目的 感想 Tips 画像認識 Incept

  • 1