“従来の日本語LLMの学習には「CC-100」「mC4」「OSCAR」などの既存のデータセットの日本語部分を使っていた。しかし、これにはWebページのHTMLをテキスト化する際のノイズが混入したり、最新の情報や知識を収録していなかっ

ookitasaburouookitasaburou のブックマーク 2023/12/21 20:10

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

日本語に強い大規模言語モデル「Swallow」 産総研と東工大が公開 事前学習用の日本語データに工夫

    産業技術総合研究所と東京工業大学の研究チームは12月19日、日語に強い大規模言語モデル(LLM)「Swallow」を公開した。米Metaが開発したLLM「Llama 2シリーズ」をベースに日語能力を改善させたもの。ライセ...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう