タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

*algorithmとNLPとcvに関するsh19910711のブックマーク (1)

  • BERTとResnetのマルチモーダルモデル「MMBT」を徹底解説 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 実務でECサイトのレコメンド精度改善のために、画像とテキストの両方を用いたマルチモーダル分類モデルを実装しました。 当初社内にマルチモーダル・ディープラーニングについての知見がなく、web記事を片っ端から漁りましたが執筆時点(2021年11月)には参考になるような日語記事はほとんど見当たりませんでした。 何とかしてマルチモーダルモデルを構築できないものかと調査したところMMBTの論文にたどり着きました。 そして、自社データを用いてモデル構築したところベースラインを上回る精度が出ましたのでここで紹介したいと思います。 これから

    BERTとResnetのマルチモーダルモデル「MMBT」を徹底解説 - Qiita
    sh19910711
    sh19910711 2024/01/18
    "データサイエンスVtuber アイシアさんの自然言語処理シリーズ / MMBT: BERTとResNet-152のベクトルを結合した後にさらにBERTに入力 / 判断根拠の可視化: nike,fear,airといった単語が注目され、画像側ではNikeのロゴマーク" / 2021
  • 1