【Gemini-1.5-Pro】マルチモーダルLLMを使って動画検索してみた

テクノロジーカテゴリーの変更を依頼記事元:

zenn.dev/cloud_ace

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

【Gemini-1.5-Pro】マルチモーダルLLMを使って動画検索してみた

こんにちは、クラウドエース SRE ディビジョン所属の茜です。今回は、マルチモーダル LLM として注目さ... こんにちは、クラウドエース SRE ディビジョン所属の茜です。今回は、マルチモーダル LLM として注目されている Gemini-1.5-Pro を使用して、自然言語での動画検索が可能な簡易的なアプリケーションを作成します。マルチモーダル LLM とはマルチモーダル LLM (Large Language Model) は、テキストだけでなく、画像、音声、動画などの複数のモダリティのデータを理解し、処理することができる大規模言語モデルです。従来の LLM がテキストのみを扱うのに対し、マルチモーダル LLM は異なる種類のデータを統合し、より幅広いタスクに対応することができます。マルチモーダル LLM は、以下のような特徴を持っています。テキスト、画像、音声、動画の双方向のやり取りが可能以下のようなタスクが実行可能です。写真の情報をテキストで出力するテキストの内容を基に画

ブックマークしたユーザー

yug12242024/06/22

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx