タグ

ブックマーク / note.com/tdual (2)

  • 類似画像検索にLLMを利用する。|tdual

    画像の類似度って難しいですよね? 同じものを表しているのに、画像としては全然違うものだからEmbeddingしてコサイン類似度を測ると遠くなることがよくあります。 なので、商品や動物などの物体を比較する場合は画像の類似度はあてになるけど、スポーツやビジネスシーン等の状況や場面の類似度は難しいという課題がありました。 例としてスポーツを見てみましょう。 以下の4枚の画像の類似度を出します。 画像1画像2画像3画像4画像1~3は野球で、画像4はバスケの画像です。 とりあえずAugNetで類似度を出しましょう。 結果 この結果を見ると一番似ているのは、画像1と画像4です。 野球画像の画像1~3同士は近く、画像4は他と遠くなって欲しい場合はどうしましょうか? そこでLLMを使ってみます。 ChatGPTのSceneXplainを使います。 SceneXplainはChatGPTのプラグインで、画像

    類似画像検索にLLMを利用する。|tdual
  • ChatGPTで自然言語処理のData Augmentationやってみた。|tdual

    ChatGPTと言っていますが、正確にはOpenAIの「code-davinci-003」というGPT-3のモデルを使っています。 ChatGPT、すごいですよね! 質問すれば、ある程度のことはいい感じの返答をしてくれますね。 例えば「〜と似た文章を作って。」メッセージをChatGPTに投げることで、似たような文章を生成できます。 入力: import openai openai.api_key = key #keyはopenaiのページから取得してください。 model_engine = "text-davinci-003" prompt = """ 「MatrixFlowは、AIの開発に特化したノーコード開発のプラットフォームです。 画面上でブロックを動かすという視覚的な操作だけでAIを開発できます。 様々な課題や要望に応じたAIモデルのテンプレートが用意されているため、テンプレート

    ChatGPTで自然言語処理のData Augmentationやってみた。|tdual
  • 1