LLaVA-NeXTで作業動画から画像入りの手順書を作成してみる

テクノロジーカテゴリーの変更を依頼記事元:

zenn.dev/firstautomation

3users がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

LLaVA-NeXTで作業動画から画像入りの手順書を作成してみる

はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！生成AIによる文章生成が発展... はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！生成AIによる文章生成が発展してく中で、入力に関して文章だけでなく様々な入力を扱えるようになってきています。音声や画像だけでなく、 GoogleのGemini 1.5 Proでは最大で1時間程度の動画を入力として扱うことができます。弊社では製造業向けの生成AIを活用したプロダクト・サービス展開を行っており、この動画入力の技術を用いて、製造現場での作業動画から作業手順書を作るということを今回試してみたいと思います。以下の2つのモデルで作業手順書の作成を行います。 Google Gemini 1.5 Pro Exp 0806 LLaVa-NexXT 前者はGoogleが提供しているクラウド環境で動く生成AIモデルです。後者はByteDanceなどの研究者たちによって作られたオープンなマルチモーダル生成AI

あとで読む

ブックマークしたユーザー

yuiseki2024/08/12
samurairodeo2024/08/12

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx