大規模言語モデルのフルスクラッチ作成の予習〜データセット取得、クリーニングまで〜｜ウチダマサトシ

テクノロジーカテゴリーの変更を依頼記事元:

note.com/uchidama

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

大規模言語モデルのフルスクラッチ作成の予習〜データセット取得、クリーニングまで〜｜ウチダマサトシ

これを使ってデータセットの取得、クリーニングまでを試してみました。実行環境はMacOS(M2 MBP)です。 ... これを使ってデータセットの取得、クリーニングまでを試してみました。実行環境はMacOS(M2 MBP)です。 GPUが入ってる学習可能なマシンが今ないので、とりあえず手持ちのMacで予習しておきます。データ収集加工手順のREADMEを元に作業してみました。リポジトリ取得git clone https://github.com/matsuolab/ucllm_nedo_prod.gitとりあえず、リポジトリを取得します。ダウンロードされるデータセットの容量が大きいので空きが大きいハードディスクで取得したほうが良いです。データのダウンロードcd ucllm_nedo_prod/preprocessing # sudo apt-get install git-lfs # pip install git-lfs # apt-get, pipで入れる方法もあるがMacOSなのでbrewでg

ブックマークしたユーザー

yuiseki2024/04/03

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx