llama2のpretrainingを試す

テクノロジーカテゴリーの変更を依頼記事元:

zenn.dev/if001

13 usersがブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

misshiki “pre_trainingのやり方 llama2の実装、huggingfaceへのupload。すべてgoogle colab上で実行します。”

2023/10/23 リンク

secondlife lit-gpt + 日本語tokenizerで学習

2023/10/23 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

llama2のpretrainingを試す

小さいサイズのllama2を日本語でpre_trainingしてみます。この記事では、以下が参考になれば良いかと思... 小さいサイズのllama2を日本語でpre_trainingしてみます。この記事では、以下が参考になれば良いかと思います pre_trainingのやり方 llama2の実装 huggingfaceへのupload すべてgoogle colab上で実行します。今回学習したモデルはここ学習にはlit-gptを使います。 lit-gptはlit-llamaのforkです。こちらの実装の参考になるのでコードを眺めてみるのもおすすめです。データセットの作成まずは学習用のデータセットを作成します。以下のコードを参考に、huggingface hubにあるデータセットから学習用のデータセットを作れるように修正します。作成したものは以下 tokenizerはhuggingface.tokenizersライブラリを使うようにしているので、適宜読み替えてください。 tokenizerには前回

ブックマークしたユーザー

yuiseki2024/03/28
yug12242023/10/24
akishin9992023/10/23
dhesusan46492023/10/23
misshiki2023/10/23
flyeagle2023/10/23
secondlife2023/10/23
s_ryuuki2023/10/22
ZAORIKU2023/10/22

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx