[B! deeplearning] tuxedokatzeのブックマーク

tuxedokatze id:tuxedokatze

deeplearningに関するtuxedokatzeのブックマーク (2)

AI開発の新たなパラダイム「基盤モデル」とは
さて、視覚・言語を扱う基盤モデルとしては、2021年の CLIP がブレイクスルーでした。CLIPはテキストと画像を同じ特徴空間に写像する2つのエンコーダからなります。CLIPを使うと、次のようにして任意の画像分類問題を追加の学習なしで解くことができます。まず、各候補クラスを文章の形式（例：「犬の写真」）にした後、テキストエンコーダに入力します。次に、分類したい画像を画像エンコーダに入力します。最後に、画像から得られたベクトルと候補クラスたちから得られた複数のベクトルとのコサイン類似度を計算し、最も類似度が高いクラスを出力結果とします。 CLIPによるゼロショット画像分類の方法。OpenAI Blogより引用 CLIPは画像とテキストというモードの異なる情報を意味的な近さによって結びつけることを可能にしました。CLIPを教師のようにして使うことで、テキストから画像を生成するモデルを訓練する
tuxedokatze 2022/07/04
deeplearning
リンク
有名なDeep Learningの特許を調べてみた - arutema47's blog
目的有名所のDNN特許を調べてみました。ほとんどがGoogleの特許ですがBatchNorm、transf ormer以外日本で登録されていないのが多いですね。調べたところで力尽きてちゃんとクレームはトップ以外読んでません。随時リストはアップデートしていきます。参考： https://www.reddit.com/r/MachineLearning/comments/c5mdm5/d_googles_patent_on_dropout_just_went_active_today/www.reddit.com 感想 Dropout,Batchnorm,transf ormerなど根幹特許を多くGoogleに抑えられていますが、基本的にはPatent Trollに対しての防衛でGoogleから権利行使することはないようです。（訴訟は今の所ない）目的感想 Tips 画像認識 Incept
tuxedokatze 2021/01/27
patent

deeplearning
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx