日本語LLMでLLaVAの学習を行ってみた - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/toshi_456

5users がブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

日本語LLMでLLaVAの学習を行ってみた - Qiita

はじめに本記事はLLM Advent Calendar 2023 2日目の記事になります。最近、様々なLLMが発表されたこと... はじめに本記事はLLM Advent Calendar 2023 2日目の記事になります。最近、様々なLLMが発表されたことによりローカルLLM界隈では自作データセットを作成して自分好みのLLMを作成するなど日本語LLM界隈は盛り上がりを見せています。一方、マルチモーダルなLLMとして画像を組み合わせたものに関してはTuring、Stability AI、Rinnaなどの企業ではモデルを公開していますが、個人で行われている方は少ないという印象があります。そこで今回はLLaVAと同じ方法で日本語LLMを学習させて、個人でマルチモーダルなLLMの学習を行ってみました。個人で学習できる範疇ということで学習はRTX4090 1台で行っています。学習に使用したコードは以下で公開しています。モデルは以下で公開しています。事前学習モデル: ファインチューニングモデル: 事前学習に使用した日

ブックマークしたユーザー

mole-studio2024/07/01
yuiseki2024/05/09
shodai2023/12/03
yug12242023/12/03

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx