記事へのコメント10

    • 注目コメント
    • 新着コメント
    hirorinya
    hirorinya ほーん、作ってみるか

    2023/07/03 リンク

    その他
    misshiki
    misshiki “Megatron-DeepSpeedとは、NVIDIAのMegatron-LMにdeepspeedが組み込まれたものです。”

    2023/06/30 リンク

    その他
    atSushi
    atSushi “ ”

    2023/06/30 リンク

    その他
    shields-pikes
    shields-pikes めちゃくちゃわかりやすい解説(すぐやりたくなったけど、GPUがなかった)。

    2023/06/30 リンク

    その他
    knok
    knok 複数マシンでやる話かと思ったら違った

    2023/06/30 リンク

    その他
    phain
    phain 注釈の入れ方がセンスある

    2023/06/30 リンク

    その他
    kj131
    kj131 “GPT-2 7B A100”

    2023/06/30 リンク

    その他
    gm91
    gm91 大言壮語モデルと空目した

    2023/06/29 リンク

    その他
    res_circuit
    res_circuit 大規模なモデルを分散並列学習させたくなったそこのあなた向け

    2023/06/29 リンク

    その他
    sys-bio
    sys-bio 有益すぎる…!!!

    2023/06/29 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    大規模言語モデル(LLM)の作り方 Megatron-DeepSpeed編 Part1

    はじめに Turing 株式会社のリサーチチームでインターンをしている東京工業大学 B4 横田研究室の藤井(@o...

    ブックマークしたユーザー

    • jp-myk2024/05/19 jp-myk
    • sanko04082024/01/07 sanko0408
    • Tormits2024/01/05 Tormits
    • anoworl2023/07/24 anoworl
    • nyaocat2023/07/04 nyaocat
    • hirorinya2023/07/03 hirorinya
    • deejayroka2023/07/01 deejayroka
    • machupicchubeta2023/07/01 machupicchubeta
    • flying-cat2023/06/30 flying-cat
    • ibadora2023/06/30 ibadora
    • amring2023/06/30 amring
    • hasunuma06132023/06/30 hasunuma0613
    • misshiki2023/06/30 misshiki
    • Econgi2023/06/30 Econgi
    • chess-news2023/06/30 chess-news
    • tuki09182023/06/30 tuki0918
    • mhako2023/06/30 mhako
    • daabtk2023/06/30 daabtk
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事